autoMate – AI本地自动化工具,自然语言实现自动化任务操作 autoMate是基于AI和RPA的本地自动化工具,用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型,用户无需编程知识,用自然语言描述任务,能完成计算机界面操作、复杂工作流执行及智... AI项目框架 4周前030
URO-Bench – AI基准测试工具,专为端到端语音对话模型设计 URO-Bench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务,全面评估语音对话模型的性能。 AI项目框架 4周前020
DINO-XSeek – IDEA 研究院推出的多模态目标检测模型 DINO-XSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINO-XSeek基于复杂的语言描述精准定位图像中的目标,识别目标的属性(如颜色、形状、动作等... AI项目框架# 4周前020
GO-1 – 智元机器人推出的首个通用具身基座模型 GO-1(Genie Operator-1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action(ViLLA)架构,由VLM(多模... AI项目框架# 4周前020
DoraCycle – 新加坡国立大学推出多模态领域适应的统一生成模型 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-to-image-to-text 和 image-to-text-to-imag... AI项目框架 4周前020
Gemini Embedding – 谷歌推出的文本嵌入模型 Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练,具备强... AI项目框架 4周前020
Heygem – 硅基智能推出的开源数字人模型 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,在 60 秒内合成 4K 超... AI项目框架 4周前080
LanDiff – 高质量文本到视频生成的混合框架 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有效克服了单一方法在语义理解... AI项目框架# 4周前020
FoxBrain – 鸿海研究院推出的推理大语言模型 FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域。FoxBrain 基于高... AI项目框架# # AI 4周前020
COMET – 字节开源的通信优化系统 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术,COMET将通信与计算操作深度融合,消... AI项目框架# 4周前030