AI项目框架 | 第29页

SWE-Kit – 构建自定义软件工程AI代理的开源框架

SWE-Kit 是Composio 推出的开源框架，简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具，用于构建自定义编码代理，支持与多种代理框架和大型语言模...

AI项目框架 # # AI

5个月前

160

Pixtral Large – Mistral AI开源的超大多模态模型

Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型，具备前沿级图像理解能力，支持128K上下文，能理解文本、图表和图像。Pixtral Large基于Mistral...

AI项目框架 # # AI

5个月前

160

OmniEdit – 滑铁卢大学等机构开源的通用图像编辑模型

OmniEdit是先进的图像编辑技术，通过结合多个专家模型的监督来训练一个通用模型，处理多种图像编辑任务。能处理不同纵横比的图像，七种不同的图像编辑任务，包括对象替换、移除、添加等，支持任意宽高比和分...

AI项目框架 #

5个月前

160

LTX Video – Lightricks推出的开源AI视频生成模型

LTX Video是Lightricks推出的开源AI视频生成模型，能在4秒内生成5秒的高质量视频，速度超过观看速度。基于2亿参数的DiT架构，确保帧间平滑运动和结构一致性，解决了早期视频生成模型的关...

AI项目框架 #

5个月前

060

Kandinsky-3 – 开源的文本到图像生成框架，适应多种图像生成任务

Kandinsky-3是基于潜在扩散模型的文本到图像（T2I）生成框架，以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务，包括文本引导的修复/扩展、图像融合、文本...

AI项目框架 # # AI

5个月前

060

Flex3D – Meta GenAI和牛津大学共同推出的两阶段3D生成框架

Flex3D是由Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架，能基于任意数量的高质量输入视图，解决从文本、单张图片或稀疏视图图像生成高质量3D内容的挑战。第一阶段，基于微调...

AI项目框架 # # AI

5个月前

060

OneDiffusion – 无缝支持双向图像合成和理解的开源扩散模型

OneDiffusion是AI2推出的多功能大规模扩散模型，能无缝支持双向图像合成和理解，涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序列“视图”训练，实现在推...

AI项目框架 # # AI

5个月前

060

Find3D – 加州理工学院推出的3D部件分割模型

Find3D是加州理工学院推出的3D部件分割模型，能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据，并用对比训练方法训练一个可扩展的3D模...

AI项目框架 # # AI

5个月前

060

HiFiVFS – 腾讯联合VIVO推出的高保真视频换脸框架

HiFiVFS（High Fidelity Video Face Swapping）是腾讯和VIVO公司推出的高保真视频换脸框架，HiFiVFS基于Stable Video Diffusion（SVD...

AI项目框架 #

5个月前

060

Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型

Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术，基于运动轨迹（motion trajectories）控制和引导视频内容的生成。Moti...

AI项目框架 #

5个月前

060