ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型 ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型,是对经典BERT模型的一次重大... AI项目框架# # AI 4个月前060
Mathtutor on Groq – AI数学辅导工具,支持用语音形式提出数学问题 Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具,基于语音识别功能,支持用户用语音形式提出数学问题。工具内置强大的数学引擎,能实时计算并用 LaTeX 格式渲染出详细的解题... AI项目框架# # AI 4个月前060
DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicControl通过自适应地选择不同条件... AI项目框架# # AI 4个月前060
Diffree – OpenGVLab推出的AI贴图框架 Diffree是由OpenGVLab推出的AI贴图框架,能根据用户的文字描述,在图片中自动找到合适的位置添加新对象。通过智能掩码预测,无需手动绘制,即可确定新对象的形状和位置。 AI项目框架# # AI 6个月前060
Stable Fast 3D – Stability AI推出的AI新模型,0.5秒将图片转为3D Stable Fast 3D(SF3D)是Stability AI推出的一种创新3D网格重建技术,能在0.5秒内从单张图片生成高质量的3D模型。Stable Fast 3D采用先进的Transform... AI项目框架# # AI 6个月前060
Tora – 阿里推出的AI视频生成框架 Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界动态的视频内容。Tora由轨迹提取器、时空DiT和运动引导融合器组成... AI项目框架# # AI 6个月前060
FoleyCrafter – 上海人工智能实验室推出的AI视频配音框架 FoleyCrafter是上海人工智能实验室和香港中文大学(深圳)共同推出的AI视频配音框架,FoleyCrafter能自动听出视频中的动作,配上恰到好处的声音效果。不管是视频里的人走路、跑步,还是动... AI项目框架# # AI 6个月前060
SEED-Story – 腾讯联合港科大、港中文推出的多模态故事生成模型 SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型(MLLM),能预测文本和视觉token,通过视觉de-tokenizer生成风格一致的图像。SE... AI项目框架# 6个月前060
Qwen2-Audio – 阿里通义千问团队推出的开源AI语音模型 Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能,支持超过8种语言。Qwen2-Audio在多个基准数据集上表现优异,现... AI项目框架# # AI 6个月前060
UniBench – Meta推出的视觉语言模型(VLM)评估框架 UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架,对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试,涵盖物体识别、空间理解、推理等多维度能力。 AI项目框架# # AI 6个月前060