VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型 VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型,通过自然语言指令精确定位图像中的目标物体,如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qwen2.5-VL 架... AI项目框架 2个月前060
MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型 MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GPT-3的1/7000,适合在普... AI项目框架 2个月前060
混元图生视频 – 腾讯混元开源的图生视频模型 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实、动漫和CGI等多种角... AI项目框架# # AI 2个月前060
Gemini 2.0 Flash – Google推出的多模态 AI 模型 Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯性。模型擅长将文本与图像结合... AI项目框架# # AI 2个月前060
MetaStone-L1-7B – 元石智算推出的轻量级推理模型 MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖水平(SOTA),与 Claude... AI项目框架# 2个月前060
MedRAG – 南洋理工团队推出的医学诊断模型 MedRAG是南洋理工大学研究团队提出的医学诊断模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力。模型构建了四层细粒度诊断知识图谱,可精准分类不同病症表现,通过主动补问机制填补患者信息空白... AI项目框架 2个月前060
SWE-Kit – 构建自定义软件工程AI代理的开源框架 SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模... AI项目框架# # AI 4个月前060
Pixtral Large – Mistral AI开源的超大多模态模型 Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral... AI项目框架# # AI 4个月前060
KuaiFormer – 快手推出的检索框架,基于Transformer KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“下一个动作预测”范式... AI项目框架# # AI 4个月前060
Kandinsky-3 – 开源的文本到图像生成框架,适应多种图像生成任务 Kandinsky-3是基于潜在扩散模型的文本到图像(T2I)生成框架,以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务,包括文本引导的修复/扩展、图像融合、文本... AI项目框架# # AI 4个月前060