AI项目框架 | 第45页

Multi-Speaker – AudioShake 推出的多说话人声分离模型

Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道，解决传统音频工具在处理重叠语音时的难题。Multi-Speaker适...

AI项目框架 #

3个月前

040

Maestro – 开源的端到端自动化测试框架

Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制，解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法，支持在yaml文件中定义测试，无需编...

AI项目框架

3个月前

040

o1-pro – OpenAI 推出的升级版推理模型

o1-pro是 OpenAI 正式推出的 o1 系列的升级版本，o1-pro 是目前 OpenAI 最强大的推理模型，核心优势在于显著提升的计算能力，能更好地应对复杂问题，提供更一致且高质量的响应。o...

AI项目框架

3个月前

040

Crack Coder – AI技术面试工具，提供实时编程问题支持

Crack Coder 是开源的隐形 AI 辅助工具，专为技术面试设计。Crack Coder支持在后台运行，完全隐形，无法被屏幕录制或监控软件检测到。Crack Coder提供实时 AI 编程辅助...

AI项目框架

3个月前

040

JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架

JanusFlow是DeepSeek推出的 Janus 系列，用在多模态理解和生成任务的模型，整合自回归语言模型与校正流技术，在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略，提...

AI项目框架 #

6个月前

040

Free Video-LLM – 无需训练的高效视频语言模型

Free Video-LLM是创新的无需训练的高效视频语言模型，基于提示引导的视觉感知技术，实现对视频内容的高效理解。模型用预训练的图像LLMs，无需额外训练即可适应视频任务，减少视频帧生成的视觉标记...

AI项目框架 #

6个月前

040

k0-math – 月之暗面Kimi推出的数学推理模型，对标o1

k0-math是月之暗面推出的最新数学推理模型，主打深入思考能力。在MATH、中考、高考、考研等数学基准测试中，k0-math的成绩超过OpenAI的o1系列模型。模型基于不断探索和试错解决数学问题...

AI项目框架 # # AI

6个月前

040

LLaMA-Mesh – 清华联合英伟达推出的自然语言生成复杂的3D模型项目

LLaMA-Mesh是清华大学和NVIDIA共同推出的项目，基于将3D网格生成与大型语言模型（LLMs）结合，实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换...

AI项目框架 #

6个月前

040

DanceFusion – 清华大学推出音频驱动舞蹈动作重建与生成的开源框架

DanceFusion是清华大学推出的开源框架，专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型，能处理社交媒体上的不完整和嘈杂骨骼数据...

AI项目框架 #

6个月前

040

Qwen2.5-Turbo – 阿里推出的长文本模型，支持上下文长度1M tokens

Qwen2.5-Turbo是阿里推出的先进语言模型，将上下文长度从 128k 扩展到了 1M ，相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本，如长篇小说、演讲稿或代码。Qwen...

AI项目框架 # # 小说

6个月前

040