Chirp 3 – 谷歌云推出的高清语音合成模型 Chirp 3 是谷歌云推出的高清语音合成模型,专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言,能捕捉人类语调的细微差别,语音输出更加贴近真实人类发音。 AI项目框架# # AI 4周前020
LangManus – AI自动化框架,多智能体协同完成复杂任务 LangManus 是 AI 自动化框架,基于分层多智能体系统设计。包含多种智能体,如协调员、规划员、研究员、程序员等,各司其职,协同完成复杂任务。框架支持多种开源语言模型,如通义千问,兼容 Open... AI快讯# # AI 4周前020
AI Companion – Zoom 推出的 AI 助手,具有记忆、推理、任务执行和协调能力 AI Companion 是 Zoom 推出AI智能助手,基于记忆、推理、任务执行和协调四大功能,成为整个 Zoom 平台上的代理,帮助用户从重复繁琐的工作中解脱出来。AI Companion 基于生... AI快讯# # AI 4周前020
GR00T N1 – 英伟达开源的人形机器人基础模型 GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大规模人形机器人数据集训练,结合真实数据... AI项目框架# 4周前020
TokenFD – 上海交大联合美团推出的细粒度图文对齐基础模型 TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特征空间中的共享,支持Token级图文交互,在处... AI快讯# 4周前030
Multi-Speaker – AudioShake 推出的多说话人声分离模型 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的难题。Multi-Speaker适... AI项目框架# 4周前040
AiSlides.chat – AI PPT 制作工具,对话式交互自动分析生成演示文稿 AiSlides.chat 是基于AI技术的对话式 PPT 制作工具。用户用自然语言输入需求或粘贴现有内容,AI 自动分析生成 PPT 大纲、逐页设计幻灯片,提供实时修改功能。AiSlides.cha... AI快讯# # AI# 导出 4周前020
ReCamMaster – 浙大联合快手等推出的视频重渲染框架 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据集和相机姿态条件,实现视频视角、运动轨迹的... AI项目框架# 4周前020
Instella – AMD开源的30亿参数系列语言模型 Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器层和32... AI项目框架# # AI 4周前020
Narakeet – AI文本转语音平台,支持 100 种语言和 800 种声音 Narakeet 是功能强大的在线平台,基于自然语音合成技术快速创建配音和旁白视频。Narakeet支持 100 种语言和 800 种声音,将文本、Word 文档、PPT 演示文稿或字幕文件转换为高质... AI快讯# 4周前020