| 第7页 | FREEIMG导航

Baichuan-Audio – 百川智能开源的端到端语音交互模型

Baichuan-Audio是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码本离散化技术将音频信号转化...

AI项目框架 # # AI

3个月前

050

Fathom – AI会议记录工具，实时生成精准的转录和智能总结

Fathom是AI会议记录工具，专为提升会议效率而设计。Fathom支持自动录制会议，实时生成精准的转录和智能总结，帮助用户在会议中无需手动记录笔记。Fathom支持与Zoom、Google Meet...

AI快讯 # # AI

3个月前

050

VidSketch – 浙江大学推出的视频动画生成框架

VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架，根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于“层级草图控制策略”动态调整...

AI项目框架 #

3个月前

050

HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架

HippoRAG 2是俄亥俄州立大学推出的检索增强生成（RAG）框架，解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank算法，将深度段落整合...

AI快讯 #

3个月前

070

xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”（Next-X Prediction）和“噪声上下文学习”（Noisy Context Learning...

AI项目框架 #

3个月前

050

TurboLearn – AI学习工具，将录音和PDF文件转为学习笔记

Turbolearn 是AI学习工具，基于AI技术将录音和PDF文件转化为高效的学习资料，如笔记、闪卡、测验和播客。Turbolearn支持笔记中插入表格、表情符号、图表和公式，提供聊天功能，帮助用户...

AI快讯 # # AI

3个月前

020

T2V-01-Director – 海螺AI推出的文生图视频镜头控制模型

T2V-01-Director 是海螺AI（MiniMax）推出的文本到视频生成工具，专注于通过自然语言指令实现精准的镜头运动控制。支持用户在生成视频时，通过简单的文字描述或预设模板，轻松实现电影级的...

AI快讯 # # AI

3个月前

050

Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型

Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型，仅需几张输入图像，能生成高质量且可动画化的 3D 头部头像，降低了计算需求。模型...

AI项目框架 #

3个月前

020

story-flicks – AI视频生成工具，一键生成高清故事短视频

story-flicks 是基于AI大模型的项目，支持一键生成高清故事短视频。用户输入故事主题后，系统基于AI技术生成包含图像、文本、音频和字幕的短视频。story-flicks 项目支持多种模型提供...

AI项目框架 # # AI

3个月前

020

ARTalk – 东京大学等机构推出的3D头部动画生成框架

ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然的面部表情及头部姿势生成。ARTalk用多尺度运动码本和滑动时间窗口技术...

AI快讯 #

3个月前

060