ORMBG - 开源的AI图像分割工具 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑... AI项目框架# # AI 5个月前0220
App Intents - 苹果推出的集成Siri和Apple Intelligence新框架 App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架,实现应用功能与系统体验(如Siri、Spotlight搜索、快捷指令... AI项目框架# 5个月前0220
BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法 BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸(2.7B语言参数和400M视... AI项目框架# # AI 3个月前0200
One Shot, One Talk - 中科大联合香港理工推出的动态图像生成技术 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作。One Shot, One Tal... AI项目框架# 3个月前0200
3D-Speaker - 阿里通义推出的多模态说话人识别任务开源项目 3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训练和推理代码,及大规模多设备... AI项目框架# 3个月前0200
StyleStudio - 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁移模型,能将参考图像的风格与文本提示的内容融合。StyleStudio基于三种策略解... AI项目框架# # AI 3个月前0190
MagicPose - AI视频生成模型,能生成逼真的人体动作和面部表情 MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型,无需任何微调,直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略,分离人体动作和外观特征,实现了在... AI项目框架# # AI 5个月前0190
VITA - 腾讯推出的开源多模态AI模型 VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了双语指令微调,支持自然人机交互,无... AI项目框架# 5个月前0190
ebook2audiobookXTTS - 开源电子书转有声书 AI 工具,支持16种语言 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现... AI项目框架# # AI 3个月前0180
NSFW Detector - 开源 AI 不适宜内容检测工具,支持识别图像、PDF、视频文件 NSFW Detector(Not Safe For Work,简称 NSFW)是开源的检测不适宜内容工具,NSFW Detector能识别图像、PDF、视频文件中的不适宜内容。工具基于Google的... AI项目框架# 3个月前0180