UniTalker – 商汤推出的音频驱动3D面部动画生成模型 UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音频类型的处理,包括语音和歌曲。 AI项目框架# 5个月前0110
HourVideo – 李飞飞和吴佳俊团队推出的长视频理解基准数据集 HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集,包含500个第一人称视角视频,时长20至120分钟,覆盖77种日常活动,能评估多模态模型对长视频的理解能力。 AI项目框架# 5个月前0110
iAgents – 清华大学推出的多AI智能体协作框架 iAgents是清华大学推出的多AI智能体协作框架,基于为每个用户配备个人AI智能体促进协作和完成日常任务。智能体能理解用户的文件、命令,从协作中学习,实现自动的信息交换和任务解决。iAgents用i... AI项目框架# # AI 3个月前0100
Documind – 开源AI文档处理工具,将PDF转换为图像提取结构化数据 Documind是开源的AI文档处理工具,能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用OpenAI API进行信息提取,根据用户定义的模式格式化输出结果的功能。Docum... AI项目框架# # AI 3个月前0100
ACE – 阿里通义实验室推出的全能图像生成和编辑模型 ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格式,能... AI项目框架# # AI 3个月前0100
Make-It-Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态,无论其形状和姿势如何。框架基于生成高质量的混... AI项目框架# 3个月前0100
360Zhinao2-7B – 360 推出自研360智脑大模型的升级版 360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版,涵盖基础模型及多种上下文长度的聊天模型。360Zhinao2-7B模型是继360Zhinao1-7B之后的重要更新,基于采用... AI项目框架# # AI 3个月前0100
FreeScale – 无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像 FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和融合不同尺度的信息,有效解决模型在生成超训练... AI项目框架# 3个月前0100
Freestyler – 西工大联合微软和香港大学推出的说唱乐生成模型 Freestyler是西北工业大学计算机科学学院音频、语音与语言处理小组(ASLP@NPU)、微软及香港中文大学深圳研究院大数据研究所共同推出的说唱乐生成模型,能直接根据歌词和伴奏创作出说唱音乐。 AI项目框架# 3个月前0100
Large Action Models – 微软推出的行动大模型开发框架 Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)的... AI项目框架# # AI 3个月前0100