MDT-A2G – 复旦&腾讯优图推出的AI模型,可根据语音同步生成手势 MDT-A2G是复旦大学和腾讯优图联合推出的AI模型,专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势,计算机能更加生动和自然地进行"表演"。 AI项目框架# # AI 7个月前050
Grok-2 – xAI公司推出的新一代AI模型 Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、编程和推理能力。在学术基准测试中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等领域的表现超越了前代Grok-1.5,与行... AI项目框架# # AI 7个月前020
VideoPrism – 谷歌研究团队推出的通用视频编码器 VideoPrism是一个由谷歌研究团队开发的通用视频编码器,旨在通过一个单一的冻结模型来处理多种视频理解任务。该模型能够从视频中提取丰富的语义表示,使其能够在不同的视频理解任务中实现高性能和准确率... AI项目框架# # AI 7个月前0120
Chameleon – Meta推出的图文混合多模态开源模型 Chameleon 是 Meta(Facebook 的母公司)的人工智能研究团队 FAIR(Facebook AI Research)发布的一个能理解和生成任意序列的图像和文本的混合多模态模型。拥有 ... AI项目框架# # AI 7个月前010
Mem0 – 一款开源的大语言模型记忆增强工具 Mem0 是一款开源的大语言模型记忆增强工具,能够让 AI 拥有长期、适应性强的记忆。通过自适应记忆系统,AI能实现跨应用记住用户的偏好和交互,提供连贯且不断进化的响应。 AI项目框架# # AI 7个月前01050
DCLM-7B – 苹果公司与合作团队推出的开源小模型 DCLM-7B是由苹果公司联合研究团队推出的70亿参数开源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,苹果公司作为 DataComp-LM(DCLM)项目的研究机构之一... AI项目框架# # AI 7个月前0130
LivePortrait – 快手推出的开源人像动画生成框架 LivePortrait是快手推出的开源人像动画生成框架,专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态人像,创造出富有表现力的视频。该技术通过隐式关键点框架实现,利用大规模高质量训练数据和... AI项目框架# # AI 7个月前01720
Llama3.1 – Meta最新发布的最强开源AI模型 Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llama 3.1支持128K的上下文长度,能够... AI项目框架# # AI 7个月前020
Diffree – OpenGVLab推出的AI贴图框架 Diffree是由OpenGVLab推出的AI贴图框架,能根据用户的文字描述,在图片中自动找到合适的位置添加新对象。通过智能掩码预测,无需手动绘制,即可确定新对象的形状和位置。 AI项目框架# # AI 7个月前070
FLUX.1 – Stable Diffusion创始团队推出的开源AI图像生成模型 FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLU... AI项目框架# # AI 7个月前070