EAFormer – 复旦推出的AI文本分割框架 EAFormer是复旦推出的AI文本分割框架。擅长在照片中找到文字,并且能很精确地把文字从背景中分离出来。即使文字的边缘很模糊或者背景很复杂,EAFormer也能做得很好。对于想要从图片中去除文字或者... AI项目框架# # AI 5个月前0150
Cradle – 通用计算机控制的多模态AI Agent框架 Cradle是面向通用计算机控制(General Computer Control, GCC)的多模态AI Agent框架,由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校... AI项目框架# # AI 5个月前0150
QwQ-32B-Preview – 阿里开源的AI推理模型,基准测试超越 o1 模型 QwQ-32B-Preview(QwQ-32B)是阿里推出的开源AI推理模型,在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处理长达32000个tokens的提示词。在多... AI项目框架# # AI 3个月前0140
Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集,专注于无机材料的结构和成分多样性。附带预训练的图神经网络模... AI项目框架# # AI 3个月前0140
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术 Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应一个物体及其相关效果(如阴影、反射等... AI项目框架# 3个月前0140
BrushEdit – 腾讯和北大等联合推出的图像编辑框架,指令引导图像编辑和修复 BrushEdit是腾讯和北京大学等机构联合推出的先进图像编辑框架,是BrushNet模型的高级迭代版本。框架结合多模态大型语言模型(MLLMs)和双分支图像修复模型,实现基于指令引导的图像编辑和修复... AI项目框架# 3个月前0140
Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎 Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。Genesis能用简单的语言描述,快速生成精确的物理模拟,包括物体运动、人物... AI项目框架# # AI 3个月前0140
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tun... AI项目框架# 3个月前0140
MotionClone – 文本驱动的AI视频动作克隆框架 MotionClone是文本驱动的AI视频动作克隆框架,通过时间注意力机制从参考视频中克隆动作,结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢体动作,实现高度逼真和控制性强的视频内容... AI项目框架# # AI 5个月前0140
CharacterFactory – 大连理工推出的AI角色创作工具 CharacterFactory是大连理工大学IIAU团队推出的AI角色创作工具,通过扩散模型在无需参考图片的情况下,仅需2.5GB显存和10分钟训练,即可快速生成具有一致性特征的新角色图像。 AI项目框架# # AI 5个月前0140