Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集,专注于无机材料的结构和成分多样性。附带预训练的图神经网络模... AI项目框架# # AI 6个月前1180
VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集 VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集,研究者构建用在评估多模态大型语言模型(ML... AI项目框架# 6个月前0180
Vision Parse – 开源的 PDF 转 Markdown 工具 Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且保... AI项目框架# # AI 6个月前0180
LanPaint – 零训练 AI 图像修复工具 LanPaint 是 为Stable Diffusion 模型设计的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝且准确的修复结果。L... AI项目框架# # AI 3个月前0170
BrushEdit – 腾讯和北大等联合推出的图像编辑框架,指令引导图像编辑和修复 BrushEdit是腾讯和北京大学等机构联合推出的先进图像编辑框架,是BrushNet模型的高级迭代版本。框架结合多模态大型语言模型(MLLMs)和双分支图像修复模型,实现基于指令引导的图像编辑和修复... AI项目框架# 6个月前0170
VE-Bench – 北京大学开源首个针对视频编辑质量评估的新指标 VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致,更准确地评估视频编辑效果。VE-Bench QA ... AI项目框架# 6个月前0170
DressCode – 上海科技大学推出的3D服装生成框架 DressCode是上海科技大学、宾夕法尼亚大学和Deemos科技联合推出的3D服装生成框架。支持用户通过文本描述来自动生成各种风格和材质的3D服装模型。 AI项目框架# 8个月前0170
MotionClone – 文本驱动的AI视频动作克隆框架 MotionClone是文本驱动的AI视频动作克隆框架,通过时间注意力机制从参考视频中克隆动作,结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢体动作,实现高度逼真和控制性强的视频内容... AI项目框架# # AI 8个月前0170
HumanVid – 专为人类图像动画生成而设计的高质量数据集 HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行... AI项目框架# 8个月前0170
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基于双分支架构,结合轻量级上下文... AI项目框架# # AI 3个月前0160