AI项目框架 | 第3页

SynCamMaster – 快手联合浙大、清华等机构推出的多视角视频生成模型

SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型，能结合6自由度相机姿势，从任意视点生成开放世界视频。SynCamMaster增强...

AI项目框架 #

6个月前

0400

BlueLM-V-3B – ViVo联合香港中文大学推出的算法和系统协同设计方法

BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法，支持高效部署多模态大型语言模型（MLLM）至移动设备。模型以小尺寸（2.7B语言参数和400M视...

AI项目框架 # # AI

6个月前

1380

CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的，计算机辅助设计（CAD）模型生成系统，根据用户的多种输入（如文本描述、图像、点云或这些输入的组合...

AI项目框架 # # AI

6个月前

0370

SAM 2.1 – Meta开源的视觉分割模型

SAM 2.1（全称Segment Anything Model 2.1）是Meta（Facebook的母公司）推出的先进视觉分割模型，用于图像和视频。基于简单的Transformer架构和流式记忆设...

AI项目框架 #

6个月前

1350

Bocha Semantic Reranker – 博查推出的语义排序模型

Bocha Semantic Reranker是博查AI推出的语义排序模型，能提升搜索应用和RAG应用中的搜索结果准确性。Bocha Semantic Reranker模型基于文本语义，对初步排序的搜...

AI项目框架 #

6个月前

0340

GLM-PC – 智谱推出的电脑智能体，基于CogAgent视觉大语言模型构建

GLM-PC是智谱AI基于CogAgent视觉多模态模型开发的通用Agent，能模拟人类操作计算机，实现“无人驾驶”PC的技术探索。GLM-PC能执行预定会议、文档处理、网页搜索总结等任务，并支持远程...

AI项目框架 # # AI

6个月前

0310

Browser Use – AI 浏览器助手，自动执行网页中的交互任务

Browser Use是专门为大语言模型服务的智能浏览器工具，创新的Python工具库，让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉识别、内容提取，并能记录...

AI项目框架 # # AI

6个月前

0310

Deep-Live-Cam – 开源的 AI 实时换脸工具

Deep-Live-Cam 是开源的AI实时换脸工具，用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台，确...

AI项目框架 # # AI

8个月前

0310

MVPaint – 腾讯PCG联合多所高校共同推出的3D纹理生成框架

MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学共同推出的3D纹理生成框架，基于同步多视角扩散技术实现高分辨率、无缝且多视图一致的3D纹理生成。MVPaint包含三个核...

AI项目框架 # # AI

6个月前

0300

Takin AudioLLM – 喜马拉雅推出的系列零样本语音生成模型

Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术，专注...

AI项目框架 #

6个月前

0300