ViDoRAG – 通义联合中科大、上交大推出的视觉文档检索增强生成框架 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理,解决传统方法在处理复杂视觉文档时的检索和推理局限性。ViDoRAG用... AI项目框架# 2个月前070
SpeciesNet – Google 开源的动物物种识别 AI 模型 SpeciesNet 是 Google 开源的人工智能模型,通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成,能识别超过 2000 种标签,包括动物物种、分类单元以及非动... AI项目框架 2个月前070
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体 Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能,展示了现代 AI 开发的核心理念。Archon 的核心功能包括智能体的快速构建、多智能体协作以及领域知识的无... AI项目框架 2个月前070
Mercury Coder – Inception Labs 推出的商业级扩散大型语言模型 Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成... AI项目框架# 2个月前070
LanPaint – 零训练 AI 图像修复工具 LanPaint 是 为Stable Diffusion 模型设计的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝且准确的修复结果。L... AI项目框架# # AI 2个月前070
MeshPad – 草图驱动的AI 3D网格生成与编辑工具 MeshPad 是基于草图输入的交互式艺术化网格生成与编辑工具,能将简单的二维草图迅速转化为高质量的 3D 网格模型,支持实时编辑。用户在草图上添加或删除线条,可对 3D 网格进行修改,如删除区域或添... AI项目框架 2个月前070
Deep Research Web UI – 开源 AI 研究助手,逐步深入挖掘研究主题 Deep Research Web UI 是开源的 AI 研究助手工具,帮助用户高效地进行深度研究。通过 AI 驱动的迭代搜索,逐步深入挖掘指定主题,以树状结构可视化研究过程,让用户清晰了解 AI 的... AI项目框架# # AI# 导出 2个月前070
PP-TableMagic – 百度飞桨团队开源的表格识别工具 PP-TableMagic 是百度飞桨团队推出的高性能表格识别工具,用在将图片中的表格结构化信息提取出来,转换为 HTML 等格式,进行进一步的数据处理和分析。PP-TableMagic 用自研的轻量... AI项目框架# 2个月前070
BodyTalk – AI视频配音工具,自动适配新语音的唇形、面部表情和肢体动作 BodyTalk是Panjaya推出的AI视频配音工具,基于生成性AI技术,将视频中的人物声音转换为其他语言,自动调整视频中人物的面部表情和肢体动作,自然地匹配新的语音模式。工具结合音频翻译、声音模仿... AI项目框架# # AI 4个月前070
MARS – 字节推出优化大模型训练效率的框架 MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术,基于缩放随机递归动量技术优化梯度... AI项目框架# 4个月前070