AI项目框架 | 第43页

FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成（IPT2V）框架，基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器（Diffusion Trans...

AI项目框架

3个月前

040

SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架

SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架，支持将单张风格图像中独特的视觉特征（如几何结构、色彩搭配、笔触等）无缝迁移到内容图像上。SigStyle...

AI项目框架

3个月前

040

Flame – 开源的多模态前端代码生成模型

Flame是开源的多模态AI模型，支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结构化训练流程，生成符合React等现代前端框架规范的代码，支持组件化、状态...

AI项目框架

3个月前

040

Phi-4-Multimodal – 微软最新推出的多模态语言模型

Phi-4-Multimodal 是微软最新推出的多模态语言模型，拥有 56 亿参数，能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异，在自动语音识别（ASR）和语音翻译（S...

AI项目框架 # # AI

3个月前

040

VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架，能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意力机制，增强文本提示对目标区...

AI项目框架 # # AI

3个月前

040

AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具

AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具，能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指纹识别，涵...

AI项目框架

3个月前

040

LDGen – 理想汽车推出的多语言文本到图像生成技术

LDGen是创新的文本到图像合成技术，通过结合大型语言模型（LLMs）与扩散模型，提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术，提取文本中的精确语义信息，基于轻量级适配器实...

AI项目框架

3个月前

040

WorldCraft – 港科大推出的3D虚拟世界创建和定制系统

WorldCraft是香港科技大学推出的基于大型语言模型（LLM）代理的3D世界创建和定制系统，用在创建和定制逼真的3D虚拟世界。基于自然语言交互，让用户能轻松生成复杂的室内外场景，对场景中的物体和布...

AI项目框架

3个月前

040

LCVD – 川大推出的可调节光照效果的肖像动画生成框架

LCVD（Lighting Controllable Video Diffusion Model）是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征（如身份和外观）与外...

AI项目框架

3个月前

040

SepLLM – 基于分隔符压缩加速大语言模型的高效框架

SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型（LLM）的高效框架，通过压缩段落信息并消除冗余标记，显著提高了模型的推理速度和计算效率。SepLLM的核心是利用分隔符（如...

AI项目框架 #

3个月前

040