AI项目框架 | 第77页

Stable Fast 3D – Stability AI推出的AI新模型，0.5秒将图片转为3D

Stable Fast 3D（SF3D）是Stability AI推出的一种创新3D网格重建技术，能在0.5秒内从单张图片生成高质量的3D模型。Stable Fast 3D采用先进的Transform...

AI项目框架 # # AI

7个月前

060

Tora – 阿里推出的AI视频生成框架

Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。Tora由轨迹提取器、时空DiT和运动引导融合器组成...

AI项目框架 # # AI

7个月前

060

Whisper-Medusa – aiOla推出的开源AI语音识别模型

Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whisper-Medusa引入了多头注意力机制，实现了并行处理，显著提升...

AI项目框架 # # AI

7个月前

040

FoleyCrafter – 上海人工智能实验室推出的AI视频配音框架

FoleyCrafter是上海人工智能实验室和香港中文大学（深圳）共同推出的AI视频配音框架，FoleyCrafter能自动听出视频中的动作，配上恰到好处的声音效果。不管是视频里的人走路、跑步，还是动...

AI项目框架 # # AI

7个月前

060

SEED-Story – 腾讯联合港科大、港中文推出的多模态故事生成模型

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token，通过视觉de-tokenizer生成风格一致的图像。SE...

AI项目框架 #

7个月前

060

FlashFace – 阿里联合香港大学推出的高保真AI写真工具

FlashFace是阿里联合香港大学推出的高保真AI写真工具。能基于用户提供的面部图像和文本提示，快速生成个性化的高保真人像写真图。FlashFace具备高保真度身份保留、即时个性化、多样化结果生成等...

AI项目框架 # # AI

7个月前

0190

EmoTalk3D – 华为、复旦联合推出的3D数字人框架

EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学共同推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达的3D会说话头像。EmoTalk3D能捕捉和再现人类在说话时的唇部动作、面部表情...

AI项目框架 #

7个月前

040

SAM 2 – Meta推出的AI对象分割模型

SAM 2（Segment Anything Model 2）是Meta推出的AI对象分割模型，专注于实时图像和视频对象分割。具备零样本泛化能力，能准确分割未知对象，并通过统一架构同时处理图像和视频...

AI项目框架 # # AI

7个月前

0120

Qwen2-Math – 阿里推出的数学专用开源AI模型

Qwen2-Math是阿里通义千问推出的基于Qwen2语言模型构建的数学解题专用开源AI模型，专为解决复杂数学问题设计。经过数学专用语料库的预训练和指令微调，表现出色于多数学基准测试。Qwen2-Ma...

AI项目框架 # # AI

7个月前

040

ExAvatar – Meta推出的3D数字形象生成模型

ExAvatar是DGIST和Meta公司Codec Avatars Lab联合推出的3D数字形象生成模型，通过简短视频克隆人像并转化为3D数字形象。支持手机扫描快速捕捉全身动作和表情，转化为逼真的3...

AI项目框架 #

7个月前

0180