热门

Stability AI开源Stable Diffusion 3 Medium文生图模型

AI工具8个月前发布 AI工具

6月12日晚间消息，人工智能初创公司Stability AI宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Medium（SD3 Medium）。Stable Diffusion 3 Medium 包含 20 亿个参数，是 Stability AI 迄今为止最先进的文本到图像开放模型，更小的 VRAM 占用空间旨在使其更适合在消费级 GPU 以及企业级 GPU 上运行。

Hugging Face模型地址：https://huggingface.co/stabilityai/stable-diffusion-3-medium

Stable Diffusion 3 Medium的基本信息

先进性：SD3 Medium 拥有20亿参数，是Stability AI 迄今为止最为复杂的图像生成模型，代表了生成式AI进化的重要里程碑。
适用性：这一模型的尺寸适中，使其成为在消费级PC、笔记本电脑以及企业级GPU上运行的理想选择，有望成为文本到图像模型的新标准。
开放性：SD3 Medium 的权重现已在非商业许可和低成本创作者许可下开放，鼓励专业艺术家、设计师、开发者和AI爱好者进行商业使用。
多平台支持：支持API试用，可在Stability平台、Stable Assistant（免费三天试用）和通过Discord的Stable Artisan上尝试。

Stable Diffusion 3 Medium的改进

照片级真实感：SD3 Medium 通过减少手部和面部的常见伪影，提供无需复杂工作流程即可生成的高质量图像。
提示遵循：模型能够理解并生成涉及空间关系、构图元素、动作和风格的复杂提示。
排版能力：借助Diffusion Transformer架构，SD3 Medium 在生成文本时实现了无伪影和拼写错误。
资源效率：模型设计考虑了资源效率，即使在标准消费级GPU上也能保持高性能，不牺牲性能。
微调能力：SD3 Medium 能够从小数据集中吸收细节，为定制化提供了强大支持。

合作伙伴

NVIDIA：Stability AI 与NVIDIA 的合作，通过NVIDIA® RTX™ GPU和TensorRT™，为所有Stable Diffusion模型，包括SD3 Medium，提供了性能上的显著提升。
AMD：AMD 对SD3 Medium 进行了优化，确保在AMD的最新APU、消费级GPU和MI-300X企业级GPU上提供高效推理。

开放与安全

Stability AI 坚定地致力于开放的生成性AI，SD3 Medium 在Stability NonCommercial Research Community License下发布，同时推出了新的Creator License，以支持商业用途。
公司采取了全面的安全措施，从模型训练到部署，确保了SD3 Medium 的安全和负责任的使用。

未来计划

Stability AI 计划根据用户反馈持续改进SD3 Medium，扩展其功能，提高性能。公司的目标是为AI生成艺术设定新的标准，使SD3 Medium 成为专业人士和爱好者的重要工具。

（消息来源：Stability AI）

AI工具 # # AI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

BIT.AI – AI驱动的文档协作知识管理平台

BIT.AI – AI驱动的文档协作知识管理平台

AI工具 # # AI

8个月前

060

Landbot – AI驱动的零编码创建聊天机器人平台，支持全渠道部署

Landbot – AI驱动的零编码创建聊天机器人平台，支持全渠道部署

AI工具 # # AI

8个月前

040

abab-music-1 – MiniMax 推出端到端 AI 音乐生成大模型

abab-music-1 – MiniMax 推出端到端 AI 音乐生成大模型

AI工具 # # AI

8个月前

040

Cerebellum – 浏览器AI助手，完成网页自动化任务和行动规划

Cerebellum – 浏览器AI助手，完成网页自动化任务和行动规划

AI工具 # # AI

8个月前

0170

暂无评论

暂无评论...