iDP3 – 斯坦福大学联合多所高校推出的改进型3D视觉运动策略 iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的3D视觉运动策略,能提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同,iDP3基于自我中... AI项目框架# 5个月前180
Proactive Agent – 清华联合面壁智能开源的新一代主动Agent交互范式 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,能预测用户需求并在没有直接指令的情况下采取行动。Proactive Agent观察环境和用户... AI项目框架# # AI 5个月前070
OminiControl – AI图像生成框架,实现图像主题控制和空间精确控制 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和空间控制,例如边缘引导和绘画生成... AI项目框架# 5个月前070
EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、文本... AI项目框架# # AI 5个月前030
Talker-Reasoner – 谷歌DeepMind推出的双思维AI代理架构 Talker-Reasoner是谷歌DeepMind推出的AI代理架构,借鉴人类的认知理论,将代理分为两个模块:Talker和Reasoner。Talker模拟人类的快速直觉思维(System 1... AI项目框架# # AI 5个月前070
Diffusion Self-Distillation – 斯坦福大学推出的零样本定制图像生成技术 Diffusion Self-Distillation(DSD)是创新的零样本定制图像生成技术,用预训练的文本到图像扩散模型自动生成数据集,并将其微调为能进行文本条件的图像到图像任务的模型。Diffu... AI项目框架# 5个月前080
CodeDPO – 北京大学联合字节共同推出的代码生成优化框架 CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架,能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制,同时构建和评估代码及其测试用例,用PageRank算法迭代更新代码片段的... AI项目框架# 5个月前070
Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型 Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集,专注于无机材料的结构和成分多样性。附带预训练的图神经网络模... AI项目框架# # AI 5个月前0180
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术 Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应一个物体及其相关效果(如阴影、反射等... AI项目框架# 5个月前0140
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务 Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言,适用于教育、娱乐和商业等多... AI项目框架# 5个月前1120