Multi-Speaker – AudioShake 推出的多说话人声分离模型 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的难题。Multi-Speaker适... AI项目框架# 3个月前040
Maestro – 开源的端到端自动化测试框架 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,支持在yaml文件中定义测试,无需编... AI项目框架 3个月前040
o1-pro – OpenAI 推出的升级版推理模型 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势在于显著提升的计算能力,能更好地应对复杂问题,提供更一致且高质量的响应。o... AI项目框架 3个月前040
Crack Coder – AI技术面试工具,提供实时编程问题支持 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐形,无法被屏幕录制或监控软件检测到。Crack Coder提供实时 AI 编程辅助... AI项目框架 3个月前040
JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架 JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略,提... AI项目框架# 6个月前040
Free Video-LLM – 无需训练的高效视频语言模型 Free Video-LLM是创新的无需训练的高效视频语言模型,基于提示引导的视觉感知技术,实现对视频内容的高效理解。模型用预训练的图像LLMs,无需额外训练即可适应视频任务,减少视频帧生成的视觉标记... AI项目框架# 6个月前040
k0-math – 月之暗面Kimi推出的数学推理模型,对标o1 k0-math是月之暗面推出的最新数学推理模型,主打深入思考能力。在MATH、中考、高考、考研等数学基准测试中,k0-math的成绩超过OpenAI的o1系列模型。模型基于不断探索和试错解决数学问题... AI项目框架# # AI 6个月前040
LLaMA-Mesh – 清华联合英伟达推出的自然语言生成复杂的3D模型项目 LLaMA-Mesh是清华大学和NVIDIA共同推出的项目,基于将3D网格生成与大型语言模型(LLMs)结合,实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换... AI项目框架# 6个月前040
DanceFusion – 清华大学推出音频驱动舞蹈动作重建与生成的开源框架 DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型,能处理社交媒体上的不完整和嘈杂骨骼数据... AI项目框架# 6个月前040
Qwen2.5-Turbo – 阿里推出的长文本模型,支持上下文长度1M tokens Qwen2.5-Turbo是阿里推出的先进语言模型,将上下文长度从 128k 扩展到了 1M ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本,如长篇小说、演讲稿或代码。Qwen... AI项目框架# # 小说 6个月前040