AI项目框架 | 第37页

谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm（中文名称：谛韵）是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包含人声和伴奏的完整歌曲。用...

AI项目框架

3个月前

050

DiffBrush – 北邮联合清华等机构推出的图像生成与编辑框架

DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的，无需训练的图像生成与编辑框架，支持用户基于手绘草图直观地控制图像生成。DiffBrush用预训练的文本到图像（T...

AI项目框架 # # AI

3个月前

050

PodAgent – 港中文、微软、小红书联合推出的播客生成框架

PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景，用多智能体协作系统（包括主持人、嘉宾和编剧）自动生成丰富且结构化的对话内容。PodAgent构建了多样化...

AI项目框架

3个月前

050

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是创新的文本到矢量图形（SVG）生成框架，通过结合大型语言模型（LLMs）和图像扩散模型，实现高质量 SVG 图形的自动化创作。通过多阶段流程，首先基于 LLMs 从文本描述生成语义...

AI项目框架

3个月前

050

NEXUS-O – 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型，能实现对语言、音频和视觉信息的全方位感知与交互。NEXUS-O能处理音频...

AI项目框架

3个月前

050

autoMate – AI本地自动化工具，自然语言实现自动化任务操作

autoMate是基于AI和RPA的本地自动化工具，用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型，用户无需编程知识，用自然语言描述任务，能完成计算机界面操作、复杂工作流执行及智...

AI项目框架

3个月前

050

DeepSeek百宝箱 – DeepSeek API在多种软件中的集成应用

DeepSeek百宝箱是 DeepSeek官方维护的 GitHub 项目，展示如何将 DeepSeek API 集成到各种流行软件中。项目列出了一系列支持 DeepSeek 的工具和应用，涵盖了从桌面...

AI项目框架 # # AI

3个月前

050

文心大模型4.5 – 百度推出的首个原生多模态大模型

文心大模型4.5是百度正式发布的最新一代首个原生多模态大模型，在多模态理解、文本和逻辑推理等方面有显著提升，多项测试表现优于GPT4.5。模型已上线百度智能云千帆大模型平台，企业用户和开发者登录即可调...

AI项目框架 # # AI

3个月前

050

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型，专门用于从任意内容生成音频和音乐。模型能处理多种输入模态，包括文本、视频、图像、音乐和音频，生成高质量的音频输出。

AI项目框架 # # AI

3个月前

050

YT Navigator – AI YouTube 内容搜索工具，自然语言查询定位关键信息

YT Navigator 是 AI 驱动的 YouTube 内容搜索工具，帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能，让用户快速定位到特定频道视频中的...

AI项目框架 # # AI

3个月前

050