AI项目框架 | 第71页

VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

VSI-Bench（Visual-Spatial Intelligence Benchmark）是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集，研究者构建用在评估多模态大型语言模型（ML...

AI项目框架 #

5个月前

0180

Univer – 开源 AI 办公工具，支持Word、Excel等文档处理全栈解决方案

Univer是开源的全栈框架，支持创建和编辑电子表格、文档及幻灯片，为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行，易于集成到各种应用中。Univer跨平台兼容性...

AI项目框架 # # 导出

5个月前

0680

Bamba-9B – 基于 Mamba2 架构的仅解码语言模型

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的，基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练，能提高大型语言模型的推理效率，特别是在处...

AI项目框架 #

5个月前

020

HelloMeme – 面部表情与姿态迁移框架，基于Stable Diffusion 1.5模型理解能力

HelloMeme是基于最新的Diffusion生成技术的框架，实现表情与姿态的迁移，HelloMeme集成空间编织注意力（Spatial Knitting Attentions）机制，基于Stabl...

AI项目框架 #

5个月前

050

Kheish – 开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务

Kheish是开源的、基于大型语言模型（LLM）的多智能体编排平台，用多个专门的角色（智能体）和灵活的工作流协调复杂任务的各个步骤，如提案生成、审核、验证和格式化，产生高质量结果。平台能无缝集成外部模...

AI项目框架 #

5个月前

000

CLEAR – 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

CLEAR是新加坡国立大学推出新型线性注意力机制，能提升预训练扩散变换器（DiTs）生成高分辨率图像的效率。基于将每个查询的注意力限制在局部窗口内，CLEAR实现了对图像分辨率的线性复杂度，降低了计算...

AI项目框架 #

5个月前

060

InvSR – 开源图像超分辨率模型，高清修复老旧照片

InvSR是创新的图像超分辨率模型，基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验，改善超分辨率的效果。InvSR的核心在于深度噪声预测器，预测器能估计出在正向扩散过程中所...

AI项目框架 #

5个月前

050

OCTAVE – Hume AI推出的语音语言模型

OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言模型，结合EVI 2模型和OpenAI、Elevenlab、Google Dee...

AI项目框架 # # AI

5个月前

090

DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术

DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的，提高人物图像动画质量的控制技术，基于从骨骼姿态和参考图像中提取有效的控制信号，无需额外的密集输入。DisPose...

AI项目框架 #

5个月前

020

Sketch2Sound – Adobe 联合西北大学推出的AI音频生成技术

Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术，能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度和音高三个控制信号，将控制信号编...

AI项目框架 # # AI

5个月前

080