QwQ-32B-Preview – 阿里开源的AI推理模型,基准测试超越 o1 模型 QwQ-32B-Preview(QwQ-32B)是阿里推出的开源AI推理模型,在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处理长达32000个tokens的提示词。在多... AI项目框架# # AI 5个月前0150
Mooncake – 月之暗面Kimi联合清华等机构推出的大模型推理架构 Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充分利用的CPU、DRAM和SSD... AI项目框架# # AI 5个月前0200
InfiMM-WebMath-40B – 字节联合中科院开源的超大规模多模态数据集 InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集,旨在提升多模态模型的图文混合推理能力,在数学领域。数据集从 Common Crawl 中提取,经过严格的筛选... AI项目框架# 5个月前040
SAM 2.1 – Meta开源的视觉分割模型 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设... AI项目框架# 5个月前1340
ShowUI – 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型 ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型,能提升图形用户界面(GUI)助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本,用交错视觉-语言-行动流统一G... AI项目框架# 5个月前070
Qwen2vl-Flux – 开源的多模态图像生成模型,支持多种生成模式 Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及Co... AI项目框架# 5个月前000
NVLM – 英伟达推出的多模态大型语言模型 NVLM是NVIDIA推出的前沿多模态大型语言模型(LLMs),在视觉-语言任务上达到与顶尖专有模型(如GPT-4o)和开放访问模型(如Llama 3-V 405B和InternVL 2)相匹敌的性能... AI项目框架# 5个月前0120
Promptriever – 信息检索模型,支持自然语言提示响应用户搜索需求 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型,能像语言模型一样接受自然语言提示,用直观的方式响应用户的搜索需求。Promptriever 基于 MS MA... AI项目框架# # AI 5个月前090
Devika – 开源的AI编程工具,理解和执行复杂的人类指令 Devika是开源的AI编程助手,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devika支持多种AI模型,具备高级规划推理能力,能进行上下文关键词提取、多语言代码... AI项目框架# # AI 5个月前000
LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型 LongLLaVA是多模态大型语言模型(MLLM),基于混合架构结合Mamba和Transformer模块,能高效处理大量图像,特别擅长视频理解和高分辨率图像分析。LongLLaVA在单个A100 8... AI项目框架# 5个月前020