CausVid – Adobe 联合 MIT 推出的自回归实时视频生成技术 CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延迟,首帧延迟仅1.3秒,生成速度达到9.4帧... AI项目框架# 5个月前0100
SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案 SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计... AI项目框架# # AI 5个月前080
Director – 构建视频智能体AI框架,用自然语言执行搜索、总结等复杂视频任务 Director是构建视频智能体的框架,用户能用自然语言命令执行复杂的视频任务,如视频搜索、编辑、合成和生成,并能即时流式传输结果。基于VideoDB的“视频即数据”基础设施,Director集成多个... AI项目框架# # AI 5个月前050
ClotheDreamer – 上海大学联合腾讯等高校推出的3D服装生成技术 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术,能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基础,基于... AI项目框架# 5个月前0440
EXAONE 3.5 – LG 推出的开源AI模型,擅长长文本处理降低模型幻觉问题 EXAONE 3.5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面... AI项目框架# # AI 5个月前090
DeepSeek-V2.5-1210 – DeepSeek V2.5 的最终版微调模型,支持联网搜索 DeepSeek-V2.5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型,DeepSeek V2.5 的最终版微调模型。模型基于Post-Training迭代,在数学... AI项目框架# # AI 5个月前060
DrivingDojo – 中科院联合美团推出的交互式驾驶世界模型数据集 DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集,用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段,覆盖完整的驾驶操作、多智能体交互以及丰富的... AI项目框架# # AI 5个月前050
FineWeb 2 – Hugging Face推出的多语言预训练数据集 FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适应不同语言的特点... AI项目框架# 5个月前040
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1.5 Pro快两倍,关键性能... AI项目框架# # AI 5个月前0120
书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列 书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的基础上进行显著增强,特别是在训练和测试策略... AI项目框架# # AI 5个月前080