谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具 DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)技术,能快速生成包含人声和伴奏的完整歌曲。用... AI项目框架 3个月前050
DiffBrush – 北邮联合清华等机构推出的图像生成与编辑框架 DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支持用户基于手绘草图直观地控制图像生成。DiffBrush用预训练的文本到图像(T... AI项目框架# # AI 3个月前050
PodAgent – 港中文、微软、小红书联合推出的播客生成框架 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化... AI项目框架 3个月前050
Chat2SVG – 文本描述实现高质量矢量图形的生成框架 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。通过多阶段流程,首先基于 LLMs 从文本描述生成语义... AI项目框架 3个月前050
NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与交互。NEXUS-O能处理音频... AI项目框架 3个月前050
autoMate – AI本地自动化工具,自然语言实现自动化任务操作 autoMate是基于AI和RPA的本地自动化工具,用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型,用户无需编程知识,用自然语言描述任务,能完成计算机界面操作、复杂工作流执行及智... AI项目框架 3个月前050
DeepSeek百宝箱 – DeepSeek API在多种软件中的集成应用 DeepSeek百宝箱是 DeepSeek官方维护的 GitHub 项目,展示如何将 DeepSeek API 集成到各种流行软件中。项目列出了一系列支持 DeepSeek 的工具和应用,涵盖了从桌面... AI项目框架# # AI 3个月前050
文心大模型4.5 – 百度推出的首个原生多模态大模型 文心大模型4.5是百度正式发布的最新一代首个原生多模态大模型,在多模态理解、文本和逻辑推理等方面有显著提升,多项测试表现优于GPT4.5。模型已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调... AI项目框架# # AI 3个月前050
AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频 AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。 AI项目框架# # AI 3个月前050
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能,让用户快速定位到特定频道视频中的... AI项目框架# # AI 3个月前050