AI项目框架 | 第63页

CausVid – Adobe 联合 MIT 推出的自回归实时视频生成技术

CausVid是Adobe和MIT共同推出的自回归实时视频生成技术，能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型，减少视频生成的延迟，首帧延迟仅1.3秒，生成速度达到9.4帧...

AI项目框架 #

5个月前

0100

SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案

SPDL（Scalable and Performant Data Loading）是 Meta AI 推出的开源数据加载工具，能提高 AI 模型训练效率。基于多线程技术，实现高吞吐量数据加载，减少计...

AI项目框架 # # AI

5个月前

080

Director – 构建视频智能体AI框架，用自然语言执行搜索、总结等复杂视频任务

Director是构建视频智能体的框架，用户能用自然语言命令执行复杂的视频任务，如视频搜索、编辑、合成和生成，并能即时流式传输结果。基于VideoDB的“视频即数据”基础设施，Director集成多个...

AI项目框架 # # AI

5个月前

050

ClotheDreamer – 上海大学联合腾讯等高校推出的3D服装生成技术

ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术，能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基础，基于...

AI项目框架 #

5个月前

0440

EXAONE 3.5 – LG 推出的开源AI模型，擅长长文本处理降低模型幻觉问题

EXAONE 3.5是LG AI研究院推出的开源AI模型，包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理，在基准测试中表现优异，特别是在实际应用、长文本处理和数学方面...

AI项目框架 # # AI

5个月前

090

DeepSeek-V2.5-1210 – DeepSeek V2.5 的最终版微调模型，支持联网搜索

DeepSeek-V2.5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型，DeepSeek V2.5 的最终版微调模型。模型基于Post-Training迭代，在数学...

AI项目框架 # # AI

5个月前

060

DrivingDojo – 中科院联合美团推出的交互式驾驶世界模型数据集

DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集，用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段，覆盖完整的驾驶操作、多智能体交互以及丰富的...

AI项目框架 # # AI

5个月前

050

FineWeb 2 – Hugging Face推出的多语言预训练数据集

FineWeb 2是Hugging Face推出的多语言预训练数据集，覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理，包括语言识别、去重、内容过滤和PII匿名化，适应不同语言的特点...

AI项目框架 #

5个月前

040

Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型

Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型，以多模态输入输出和Agent技术为核心，速度比 1.5 Pro快两倍，关键性能...

AI项目框架 # # AI

5个月前

0120

书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列

书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型（MLLM）系列。该系列模型在InternVL 2.0的基础上进行显著增强，特别是在训练和测试策略...

AI项目框架 # # AI

5个月前

080