AI项目框架 | 第80页

ORMBG – 开源的AI图像分割工具

ORMBG是开源的AI图像分割工具，由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景，用先进的图像处理技术，实现对图像中前景和背景的精确区分，常用于照片编辑...

AI项目框架 # # AI

7个月前

0270

Cradle – 通用计算机控制的多模态AI Agent框架

Cradle是面向通用计算机控制（General Computer Control, GCC）的多模态AI Agent框架，由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校...

AI项目框架 # # AI

7个月前

0150

Linly-Dubbing – 开源AI视频工具，支持配音、翻译、对口型

Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具，能自动将视频内容翻译成多种语言，并生成字幕。通过WhisperX和FunASR进行精准语音识别，基于Edge TTS、XTTS ...

AI项目框架 # # AI

7个月前

03250

VITA – 腾讯推出的开源多模态AI模型

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型（MLLM），能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型，扩展了中文词汇量，进行了双语指令微调，支持自然人机交互，无...

AI项目框架 #

7个月前

0230

ControlNeXt – AI图像和视频可控生成框架

ControlNeXt是一种新型的AI图像和视频可控生成框架，由香港中文大学和商汤科技联合开发。采用轻量化控制模块和创新的交叉归一化技术，大幅降低计算资源和训练难度，同时保持生成内容的高质量和多样性。

AI项目框架 # # AI

7个月前

040

GaussianEditor – 一种3D编辑算法，支持快速且精确地修改3D场景

GaussianEditor 是一种基于高斯飞溅（Gaussian Splatting）的3D编辑算法，支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅，提供了高度的编辑控制和稳定性...

AI项目框架 #

7个月前

090

VideoGameBunny – 专为视频游戏设计的开源多模态大模型

VideoGameBunny（VGB）是一个专为视频游戏设计的开源大型多模态模型，由加拿大阿尔伯塔大学研究团队开发。它能理解和生成多种语言的游戏相关内容，支持高度定制化，具备强大的文本生成能力。

AI项目框架 #

7个月前

030

LanceDB – 为AI应用设计的无服务器向量数据库，降低运维成本

LanceDB 是一款专为人工智能应用设计的无服务器向量数据库，支持向量搜索、全文搜索和SQL查询，优化了多模态数据处理。它采用向量索引技术，实现高效相似度搜索，且扩展性依赖于磁盘，提高了稳定性和扩展...

AI项目框架 # # AI

7个月前

060

NanoFlow – 优化大语言模型推理吞吐量的服务框架

NNanoFlow 是一个高性能的服务框架，专为大型语言模型（LLMs）设计，以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源，优化了模型的推理过程。

AI项目框架 #

7个月前

040

ConFiner – 高质量长视频生成框架，可制作长达600帧的连贯视频

ConFiner 是一个创新的视频生成框架，由多所大学和研究机构共同推出。结合多个现成的扩散模型专家，无需额外训练可生成高质量且连贯的视频内容。

AI项目框架 #

7个月前

0190