AI项目框架 | 第56页

iDP3 – 斯坦福大学联合多所高校推出的改进型3D视觉运动策略

iDP3（Improved 3D Diffusion Policy）是斯坦福大学联合多所高校推出的3D视觉运动策略，能提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同，iDP3基于自我中...

AI项目框架 #

5个月前

180

Proactive Agent – 清华联合面壁智能开源的新一代主动Agent交互范式

Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式，具备主动性，能预测用户需求并在没有直接指令的情况下采取行动。Proactive Agent观察环境和用户...

AI项目框架 # # AI

5个月前

070

OminiControl – AI图像生成框架，实现图像主题控制和空间精确控制

OminiControl是高度通用且参数高效的图像生成框架，为扩散变换器模型如FLUX.1设计，实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和空间控制，例如边缘引导和绘画生成...

AI项目框架 #

5个月前

070

EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型

EMOVA（EMotionally Omni-present Voice Assistant）是多模态全能模型，是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、文本...

AI项目框架 # # AI

5个月前

030

Talker-Reasoner – 谷歌DeepMind推出的双思维AI代理架构

Talker-Reasoner是谷歌DeepMind推出的AI代理架构，借鉴人类的认知理论，将代理分为两个模块：Talker和Reasoner。Talker模拟人类的快速直觉思维（System 1...

AI项目框架 # # AI

5个月前

070

Diffusion Self-Distillation – 斯坦福大学推出的零样本定制图像生成技术

Diffusion Self-Distillation（DSD）是创新的零样本定制图像生成技术，用预训练的文本到图像扩散模型自动生成数据集，并将其微调为能进行文本条件的图像到图像任务的模型。Diffu...

AI项目框架 #

5个月前

080

CodeDPO – 北京大学联合字节共同推出的代码生成优化框架

CodeDPO是北京大学与字节跳动合作推出的代码生成优化框架，能提升代码模型在正确性和效率方面的表现。框架基于自生成和验证机制，同时构建和评估代码及其测试用例，用PageRank算法迭代更新代码片段的...

AI项目框架 #

5个月前

070

Open Materials 2024 – Meta 开源的大型开放数据集和配套预训练模型

Open Materials 2024 (OMat24) 是Meta推出的包含超过1.1亿个结构的密度泛函理论(DFT)计算的大型开放数据集，专注于无机材料的结构和成分多样性。附带预训练的图神经网络模...

AI项目框架 # # AI

5个月前

0180

Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术

Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术，能将视频智能分解为多个透明背景的RGBA图层，每个图层对应一个物体及其相关效果（如阴影、反射等...

AI项目框架 #

5个月前

0140

Voice-Pro – 开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

Voice-Pro是开源的多功能音频处理工具，集成语音转文字（STT）、文本转语音（TTS）、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言，适用于教育、娱乐和商业等多...

AI项目框架 #

5个月前

1120