AI项目框架 | 第23页

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像中的目标物体，如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qwen2.5-VL 架...

AI项目框架

2个月前

060

MiniMind – 开源的AI模型训练工具，2小时训练25.8M小模型

MiniMind 是开源的超小型语言模型项目，极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计，最小版本仅需25.8M参数，体积仅为GPT-3的1/7000，适合在普...

AI项目框架

2个月前

060

混元图生视频 – 腾讯混元开源的图生视频模型

混元图生视频是腾讯混元推出的开源图生视频模型，用户可以通过上传一张图片进行简短描述，让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实、动漫和CGI等多种角...

AI项目框架 # # AI

2个月前

060

Gemini 2.0 Flash – Google推出的多模态 AI 模型

Gemini 2.0 Flash是Google推出的多模态AI模型，结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像，支持多轮对话式的图像编辑，保持上下文连贯性。模型擅长将文本与图像结合...

AI项目框架 # # AI

2个月前

060

MetaStone-L1-7B – 元石智算推出的轻量级推理模型

MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型，专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖水平（SOTA），与 Claude...

AI项目框架 #

2个月前

060

MedRAG – 南洋理工团队推出的医学诊断模型

MedRAG是南洋理工大学研究团队提出的医学诊断模型，通过结合知识图谱推理增强大语言模型（LLM）的诊断能力。模型构建了四层细粒度诊断知识图谱，可精准分类不同病症表现，通过主动补问机制填补患者信息空白...

AI项目框架

2个月前

060

SWE-Kit – 构建自定义软件工程AI代理的开源框架

SWE-Kit 是Composio 推出的开源框架，简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具，用于构建自定义编码代理，支持与多种代理框架和大型语言模...

AI项目框架 # # AI

4个月前

060

Pixtral Large – Mistral AI开源的超大多模态模型

Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型，具备前沿级图像理解能力，支持128K上下文，能理解文本、图表和图像。Pixtral Large基于Mistral...

AI项目框架 # # AI

4个月前

060

KuaiFormer – 快手推出的检索框架，基于Transformer

KuaiFormer是快手技术团队推出的基于Transformer的检索框架，用在大规模内容推荐系统。基于重新定义检索流程，从传统的分数估计任务转变为Transformer驱动的“下一个动作预测”范式...

AI项目框架 # # AI

4个月前

060

Kandinsky-3 – 开源的文本到图像生成框架，适应多种图像生成任务

Kandinsky-3是基于潜在扩散模型的文本到图像（T2I）生成框架，以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务，包括文本引导的修复/扩展、图像融合、文本...

AI项目框架 # # AI

4个月前

060