AIMv2 - 苹果开源的多模态自回归预训练视觉模型 AIMv2是苹果公司开源的多模态自回归预训练视觉模型,通过图像和文本的深度融合提升视觉模型的性能。采用创新的预训练框架,将图像划分为非重叠的图像块,将文本分解为子词令牌,然后将两者拼接为统一序列进行自... AI项目框架 2周前020
AI-Infra-Guard - 腾讯开源的 AI 基础设施安全评估工具 AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指纹识别,涵... AI项目框架 2周前020
LDGen - 理想汽车推出的多语言文本到图像生成技术 LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息,基于轻量级适配器实... AI项目框架 2周前020
WorldCraft - 港科大推出的3D虚拟世界创建和定制系统 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布... AI项目框架 2周前040
Mahilo - AI多智能体框架,支持创建与人类互动的多智能体系统 Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督和控制。Mahilo 提供强大的组织级策... AI项目框架 2周前020
Mobius - 重庆邮电联合美团等推出的无缝循环视频生成技术 Mobius 是先进的无缝循环视频生成技术,能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型,能自动识别视频中的关键元素并生成平滑过渡的循环片段,无需用户进行复杂的编辑。 AI项目框架 2周前020
WarriorCoder - 微软联合华南理工大学推出的代码生成大模型 WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。与传统方法不同,WarriorCode... AI项目框架 2周前020
xAR - 字节联合霍普金斯大学推出的自回归视觉生成框架 xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context Learning... AI项目框架# 2周前020
WhisperChain - AI实时语音转文字工具,自动对文本进行清理和优化 WhisperChain 是开源的语音识别工具,基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别,将语音转换为文本,基于 LangChain 对文本进行清... AI项目框架 2周前020
Avat3r - 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头像,降低了计算需求。模型... AI项目框架# 2周前020