Proxy Lite – 开源视觉语言模型,支持自动化网页任务 Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单填写等重复性工作,显著降低自动化... AI项目框架 3个月前040
QwQ-32B – 阿里通义千问开源的最新推理模型 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 DeepSeek-R1 满血版。模型... AI项目框架# 3个月前040
Aya Vision – Cohere 推出多模态、多语言的视觉模型 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文本翻译和多语言摘要生成等任务。 AI项目框架 3个月前040
GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存指导视频生成,用输入图像或视... AI项目框架 3个月前040
LanDiff – 高质量文本到视频生成的混合框架 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有效克服了单一方法在语义理解... AI项目框架# 3个月前040
MT-MegatronLM – 摩尔线程开源的混合并行训练框架 MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE(混合专家)模型的训练。框架基于全功... AI项目框架# # AI 3个月前040
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架 MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计。框架通过算子融合、并行加速等技术,充分基于摩尔线程全功能 GPU 的计算潜力... AI项目框架 3个月前040
Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知 Open-LLM-VTuber 是开源的跨平台语音交互 AI 伴侣项目。支持实时语音对话、视觉感知,配备生动的 Live2D 动态形象,能完全离线运行,保护隐私。用户将其作为虚拟女友、男友或宠物,享受... AI项目框架 3个月前040
Multi-Speaker – AudioShake 推出的多说话人声分离模型 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的难题。Multi-Speaker适... AI项目框架# 3个月前040
Maestro – 开源的端到端自动化测试框架 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,支持在yaml文件中定义测试,无需编... AI项目框架 3个月前040