OmniVision – 专为边缘设备优化的最小参数多模态模型 OmniVision是紧凑的多模态模型,拥有968M参数,专为边缘设备优化。OmniVision能处理视觉和文本输入,基于LLaVA架构改进,显著减少图像token数量,降低延迟和计算成本。基于可信数... AI项目框架# 3个月前080
法信法律基座大模型 – 最高法发布法律行业千亿参数通用大模型 法信法律基座大模型是基于清华大学与面壁智能科研成果转化的千亿参数通用大模型,由最高人民法院发布,定位为国家级法律AI基础设施。提供生成式AI底层能力,配套安全治理机制,保障法律AI安全发展。法信法律基... AI项目框架# # AI 3个月前080
TÜLU 3 – Ai2 推出的系列开源指令遵循模型 TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本,提供了详细的后训练... AI项目框架# # AI 3个月前080
HART – 麻省理工学院推出的自回归视觉生成模型 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直接生成1024×1024像素的高分辨率图像,质量媲美扩散模型。HART... AI项目框架# 3个月前080
ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SVD)的生成先验合成远超出训练视图范围的新... AI项目框架# 3个月前080
OpenScholar – 华盛顿大学联合艾伦研究所开源的学术搜索工具 OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据库,用定制的检索器和重排器,及... AI项目框架# # AI 3个月前080
Diffusion Self-Distillation – 斯坦福大学推出的零样本定制图像生成技术 Diffusion Self-Distillation(DSD)是创新的零样本定制图像生成技术,用预训练的文本到图像扩散模型自动生成数据集,并将其微调为能进行文本条件的图像到图像任务的模型。Diffu... AI项目框架# 3个月前080
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务 Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言,适用于教育、娱乐和商业等多... AI项目框架# 3个月前080
MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法 MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长视频的生成。基于流匹配增强模型的可扩展... AI项目框架# 3个月前080
Aurora – xAI为Grok AI助手推出的新图像生成模型 Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Aurora 的可用性因用户等级而异... AI项目框架# # AI 3个月前080