AI项目框架 | 第26页

ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型，是对经典BERT模型的一次重大...

AI项目框架 # # AI

4个月前

060

Mathtutor on Groq – AI数学辅导工具，支持用语音形式提出数学问题

Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具，基于语音识别功能，支持用户用语音形式提出数学问题。工具内置强大的数学引擎，能实时计算并用 LaTeX 格式渲染出详细的解题...

AI项目框架 # # AI

4个月前

060

DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型（MLLM）推理能力的文本生成图像（T2I）任务新框架。DynamicControl通过自适应地选择不同条件...

AI项目框架 # # AI

4个月前

060

Diffree – OpenGVLab推出的AI贴图框架

Diffree是由OpenGVLab推出的AI贴图框架，能根据用户的文字描述，在图片中自动找到合适的位置添加新对象。通过智能掩码预测，无需手动绘制，即可确定新对象的形状和位置。

AI项目框架 # # AI

6个月前

060

Stable Fast 3D – Stability AI推出的AI新模型，0.5秒将图片转为3D

Stable Fast 3D（SF3D）是Stability AI推出的一种创新3D网格重建技术，能在0.5秒内从单张图片生成高质量的3D模型。Stable Fast 3D采用先进的Transform...

AI项目框架 # # AI

6个月前

060

Tora – 阿里推出的AI视频生成框架

Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。Tora由轨迹提取器、时空DiT和运动引导融合器组成...

AI项目框架 # # AI

6个月前

060

FoleyCrafter – 上海人工智能实验室推出的AI视频配音框架

FoleyCrafter是上海人工智能实验室和香港中文大学（深圳）共同推出的AI视频配音框架，FoleyCrafter能自动听出视频中的动作，配上恰到好处的声音效果。不管是视频里的人走路、跑步，还是动...

AI项目框架 # # AI

6个月前

060

SEED-Story – 腾讯联合港科大、港中文推出的多模态故事生成模型

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token，通过视觉de-tokenizer生成风格一致的图像。SE...

AI项目框架 #

6个月前

060

Qwen2-Audio – 阿里通义千问团队推出的开源AI语音模型

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型，支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能，支持超过8种语言。Qwen2-Audio在多个基准数据集上表现优异，现...

AI项目框架 # # AI

6个月前

060

UniBench – Meta推出的视觉语言模型(VLM)评估框架

UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架，对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试，涵盖物体识别、空间理解、推理等多维度能力。

AI项目框架 # # AI

6个月前

060