ORMBG – 开源的AI图像分割工具 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑... AI项目框架# # AI 7个月前0270
Cradle – 通用计算机控制的多模态AI Agent框架 Cradle是面向通用计算机控制(General Computer Control, GCC)的多模态AI Agent框架,由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校... AI项目框架# # AI 7个月前0150
Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型 Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge TTS、XTTS ... AI项目框架# # AI 7个月前03250
VITA – 腾讯推出的开源多模态AI模型 VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了双语指令微调,支持自然人机交互,无... AI项目框架# 7个月前0230
ControlNeXt – AI图像和视频可控生成框架 ControlNeXt是一种新型的AI图像和视频可控生成框架,由香港中文大学和商汤科技联合开发。采用轻量化控制模块和创新的交叉归一化技术,大幅降低计算资源和训练难度,同时保持生成内容的高质量和多样性。 AI项目框架# # AI 7个月前040
GaussianEditor – 一种3D编辑算法,支持快速且精确地修改3D场景 GaussianEditor 是一种基于高斯飞溅(Gaussian Splatting)的3D编辑算法,支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅,提供了高度的编辑控制和稳定性... AI项目框架# 7个月前090
VideoGameBunny – 专为视频游戏设计的开源多模态大模型 VideoGameBunny(VGB)是一个专为视频游戏设计的开源大型多模态模型,由加拿大阿尔伯塔大学研究团队开发。它能理解和生成多种语言的游戏相关内容,支持高度定制化,具备强大的文本生成能力。 AI项目框架# 7个月前030
LanceDB – 为AI应用设计的无服务器向量数据库,降低运维成本 LanceDB 是一款专为人工智能应用设计的无服务器向量数据库,支持向量搜索、全文搜索和SQL查询,优化了多模态数据处理。它采用向量索引技术,实现高效相似度搜索,且扩展性依赖于磁盘,提高了稳定性和扩展... AI项目框架# # AI 7个月前060
NanoFlow – 优化大语言模型推理吞吐量的服务框架 NNanoFlow 是一个高性能的服务框架,专为大型语言模型(LLMs)设计,以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源,优化了模型的推理过程。 AI项目框架# 7个月前040
ConFiner – 高质量长视频生成框架,可制作长达600帧的连贯视频 ConFiner 是一个创新的视频生成框架,由多所大学和研究机构共同推出。结合多个现成的扩散模型专家,无需额外训练可生成高质量且连贯的视频内容。 AI项目框架# 7个月前0190