AI项目框架 | 第7页

Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型

Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集，专注于无机材料的结构和成分多样性。附带预训练的图神经网络模...

AI项目框架 # # AI

6个月前

1180

VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

VSI-Bench（Visual-Spatial Intelligence Benchmark）是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集，研究者构建用在评估多模态大型语言模型（ML...

AI项目框架 #

6个月前

0180

Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse是开源的PDF文档转换工具，基于视觉语言模型（Vision LLMs）将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格，且保...

AI项目框架 # # AI

6个月前

0180

LanPaint – 零训练 AI 图像修复工具

LanPaint 是为Stable Diffusion 模型设计的高质量图像修复工具，无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果，支持无缝且准确的修复结果。L...

AI项目框架 # # AI

3个月前

0170

BrushEdit – 腾讯和北大等联合推出的图像编辑框架，指令引导图像编辑和修复

BrushEdit是腾讯和北京大学等机构联合推出的先进图像编辑框架，是BrushNet模型的高级迭代版本。框架结合多模态大型语言模型（MLLMs）和双分支图像修复模型，实现基于指令引导的图像编辑和修复...

AI项目框架 #

6个月前

0170

VE-Bench – 北京大学开源首个针对视频编辑质量评估的新指标

VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致，更准确地评估视频编辑效果。VE-Bench QA ...

AI项目框架 #

6个月前

0170

DressCode – 上海科技大学推出的3D服装生成框架

DressCode是上海科技大学、宾夕法尼亚大学和Deemos科技联合推出的3D服装生成框架。支持用户通过文本描述来自动生成各种风格和材质的3D服装模型。

AI项目框架 #

8个月前

0170

MotionClone – 文本驱动的AI视频动作克隆框架

MotionClone是文本驱动的AI视频动作克隆框架，通过时间注意力机制从参考视频中克隆动作，结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢体动作，实现高度逼真和控制性强的视频内容...

AI项目框架 # # AI

8个月前

0170

HumanVid – 专为人类图像动画生成而设计的高质量数据集

HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集，专为人类图像动画训练设计。结合了现实世界视频和合成数据，通过精心设计的规则筛选高质量视频，并使用2D姿势估计和SLAM技术进行...

AI项目框架 #

8个月前

0170

VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架，专门用在处理任意长度的视频内容。VideoPainter基于双分支架构，结合轻量级上下文...

AI项目框架 # # AI

3个月前

0160