Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型

Mistral Small 3.1是什么

Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型，有 240 亿参数，基于 Apache 2.0 许可证发布。在文本和多模态任务上表现出色，支持长达 128k tokens 的上下文窗口，推理速度可达每秒 150 个 token，低延迟且高效。模型在多项基准测试中表现优异，例如在 MMLU、MMLU Pro 等测试中准确率较高。具备强大的多模态理解能力，能处理图像与文本结合的任务。

Mistral Small 3.1的主要功能

文本与图像处理：能同时处理文本和视觉输入，提供深入分析。可以分析图像并生成描述性文本。
长上下文窗口：支持长达 128k tokens 的上下文窗口，能处理长文本，适合需要深入对话和分析的场景。
快速推理：推理速度可达每秒 150 个 token，适合需要快速响应的应用，如虚拟助手。
轻量级设计：模型参数量为 240 亿，可在单个 RTX 4090 或 32GB RAM 的 Mac 上运行，适合在本地设备上部署。
多语言支持：支持多达 25 种语言，适合全球用户。

Mistral Small 3.1的技术原理

架构设计：Mistral Small 3.1 采用了先进的 Transformer 架构，结合了混合专家（Mixture of Experts, MoE）技术。支持模型在推理时仅使用部分参数，显著提高计算效率。
多模态处理：模型通过模态编码器和投影模块与大语言模型相结合，能处理文本和图像等多种输入形式。支持任意大小和数量的图像输入。
推理优化：模型采用了滑动窗口注意力机制（Sliding Window Attention），通过滚动缓冲区缓存（Rolling Buffer Cache）技术，优化了长序列的处理效率。允许模型在处理长文本时，逐步更新缓存，提高推理速度。
开源与定制：模型基于 Apache 2.0 许可证发布，支持开发者自由修改、部署和集成到各种应用程序中。