FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架 FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Diffusion Trans... AI项目框架 3个月前040
SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架 SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架,支持将单张风格图像中独特的视觉特征(如几何结构、色彩搭配、笔触等)无缝迁移到内容图像上。SigStyle... AI项目框架 3个月前040
Flame – 开源的多模态前端代码生成模型 Flame是开源的多模态AI模型,支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结构化训练流程,生成符合React等现代前端框架规范的代码,支持组件化、状态... AI项目框架 3个月前040
Phi-4-Multimodal – 微软最新推出的多模态语言模型 Phi-4-Multimodal 是微软最新推出的多模态语言模型,拥有 56 亿参数,能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异,在自动语音识别(ASR)和语音翻译(S... AI项目框架# # AI 3个月前040
VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架 VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意力机制,增强文本提示对目标区... AI项目框架# # AI 3个月前040
AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具 AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指纹识别,涵... AI项目框架 3个月前040
LDGen – 理想汽车推出的多语言文本到图像生成技术 LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息,基于轻量级适配器实... AI项目框架 3个月前040
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布... AI项目框架 3个月前040
LCVD – 川大推出的可调节光照效果的肖像动画生成框架 LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征(如身份和外观)与外... AI项目框架 3个月前040
SepLLM – 基于分隔符压缩加速大语言模型的高效框架 SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型(LLM)的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率。SepLLM的核心是利用分隔符(如... AI项目框架# 3个月前040