ClotheDreamer - 上海大学联合腾讯等高校推出的3D服装生成技术 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术,能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基础,基于... AI项目框架# 3个月前0280
SAM 2.1 - Meta开源的视觉分割模型 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设... AI项目框架# 3个月前0270
Browser Use - AI 浏览器助手,自动执行网页中的交互任务 Browser Use是专门为大语言模型服务的智能浏览器工具,创新的Python工具库,让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉识别、内容提取,并能记录... AI项目框架# # AI 3个月前0270
Bocha Semantic Reranker - 博查推出的语义排序模型 Bocha Semantic Reranker是博查AI推出的语义排序模型,能提升搜索应用和RAG应用中的搜索结果准确性。Bocha Semantic Reranker模型基于文本语义,对初步排序的搜... AI项目框架# 3个月前0260
GLM-PC - 智谱推出的电脑智能体,基于CogAgent视觉大语言模型构建 GLM-PC是智谱AI基于CogAgent视觉多模态模型开发的通用Agent,能模拟人类操作计算机,实现“无人驾驶”PC的技术探索。GLM-PC能执行预定会议、文档处理、网页搜索总结等任务,并支持远程... AI项目框架# # AI 3个月前0240
SynCamMaster - 快手联合浙大、清华等机构推出的多视角视频生成模型 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开放世界视频。SynCamMaster增强... AI项目框架# 3个月前0240
Illustrious - 开源文本到图像生成模型,专注于生成高质量动漫风格图像 Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高分辨率、动态色域和... AI项目框架# # AI 3个月前0220
Takin AudioLLM - 喜马拉雅推出的系列零样本语音生成模型 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专注... AI项目框架# 3个月前0220
MyTimeMachine - AI个性化面部年龄转换技术,实现20至40年的时间跨度 MyTimeMachine(MyTM)是先进的个性化面部年龄转换技术,基于大约50张个人照片,跨越20至40年的时间跨度,训练一个适配器网络个性化预训练的全局老化模型。MyTimeMachine能实现... AI项目框架# 3个月前0220
ORMBG - 开源的AI图像分割工具 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑... AI项目框架# # AI 5个月前0220