TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型 TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自适应地调整去噪... AI项目框架# 5个月前070
TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型 TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大模型能确保视频中主体外观的一致性,精确... AI项目框架# # AI 5个月前020
Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯 Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础,支持Ollama或OpenAI兼容的端点,用SearXNG... AI项目框架# # AI 5个月前090
ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tuning-free)的D... AI项目框架# 5个月前070
Micro LLAMA – 教学版 LLAMA 3模型实现,用于学习大模型的核心原理 Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLAMA 3中最小的8B参数模型... AI项目框架# 5个月前090
GenCast – 谷歌DeepMind推出的AI气象预测模型 GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统ENS,尤其在极端天气... AI项目框架# # AI 5个月前080
FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准 FullStack Bench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStack Bench覆盖超过11种真实编程场景,包含33... AI项目框架# # AI 5个月前070
Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术,基于运动轨迹(motion trajectories)控制和引导视频内容的生成。Moti... AI项目框架# 5个月前060
ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除背景噪声,保留语音清晰度,且最小化... AI项目框架# 5个月前020
Fish Speech 1.5 – Fish Audio 推出的语音合成模型,支持13种语言 Fish Speech 1.5 是Fish Audio 推出的文本到语音(TTS)模型,基于深度学习技术如Transformer、VITS、VQVAE和GPT等。Fish Speech 1.5支持英语... AI项目框架# # AI 5个月前060