SWE-Kit – 构建自定义软件工程AI代理的开源框架 SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模... AI项目框架# # AI 5个月前160
Pixtral Large – Mistral AI开源的超大多模态模型 Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral... AI项目框架# # AI 5个月前160
OmniEdit – 滑铁卢大学等机构开源的通用图像编辑模型 OmniEdit是先进的图像编辑技术,通过结合多个专家模型的监督来训练一个通用模型,处理多种图像编辑任务。能处理不同纵横比的图像,七种不同的图像编辑任务,包括对象替换、移除、添加等,支持任意宽高比和分... AI项目框架# 5个月前160
LTX Video – Lightricks推出的开源AI视频生成模型 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基于2亿参数的DiT架构,确保帧间平滑运动和结构一致性,解决了早期视频生成模型的关... AI项目框架# 5个月前060
Kandinsky-3 – 开源的文本到图像生成框架,适应多种图像生成任务 Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务,包括文本引导的修复/扩展、图像融合、文本... AI项目框架# # AI 5个月前060
Flex3D – Meta GenAI和牛津大学共同推出的两阶段3D生成框架 Flex3D是由Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架,能基于任意数量的高质量输入视图,解决从文本、单张图片或稀疏视图图像生成高质量3D内容的挑战。第一阶段,基于微调... AI项目框架# # AI 5个月前060
OneDiffusion – 无缝支持双向图像合成和理解的开源扩散模型 OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像建模为序列“视图”训练,实现在推... AI项目框架# # AI 5个月前060
Find3D – 加州理工学院推出的3D部件分割模型 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,并用对比训练方法训练一个可扩展的3D模... AI项目框架# # AI 5个月前060
HiFiVFS – 腾讯联合VIVO推出的高保真视频换脸框架 HiFiVFS(High Fidelity Video Face Swapping)是腾讯和VIVO公司推出的高保真视频换脸框架,HiFiVFS基于Stable Video Diffusion(SVD... AI项目框架# 5个月前060
Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型 Motion Prompting是 Google DeepMind、密歇根大学和布朗大学联合推出的视频生成技术,基于运动轨迹(motion trajectories)控制和引导视频内容的生成。Moti... AI项目框架# 5个月前060