PodAgent – 港中文、微软、小红书联合推出的播客生成框架 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化... AI项目框架 2个月前050
Chat2SVG – 文本描述实现高质量矢量图形的生成框架 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。通过多阶段流程,首先基于 LLMs 从文本描述生成语义... AI项目框架 2个月前040
QwQ-32B – 阿里通义千问开源的最新推理模型 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 DeepSeek-R1 满血版。模型... AI项目框架# 2个月前040
Light-R1 – 360智脑开源的长思维链推理模型 Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两阶段课程学习(SFT... AI项目框架# # AI 2个月前0130
SpatialVLA – 上海 AI Lab 联合上科大等推出的空间具身通用操作模型 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为机器人赋予通用的3D空间理解能力。SpatialVL... AI项目框架 2个月前020
TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学定理。TheoremExplainAgent支... AI项目框架 2个月前030
Aya Vision – Cohere 推出多模态、多语言的视觉模型 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文本翻译和多语言摘要生成等任务。 AI项目框架 2个月前040
BGE-VL – 智源研究院联合多所高校开源的多模态向量模型 BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务,如图文检索和组合图像检索,基于高效的多模态数据合成方... AI项目框架 2个月前020
混元图生视频 – 腾讯混元开源的图生视频模型 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实、动漫和CGI等多种角... AI项目框架# # AI 2个月前060
Granite 3.2 – IBM 开源的多模态系列 AI 模型 Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruct 提供实验性链式推理能力,显... AI项目框架 2个月前020