AI项目框架 | 第5页

One Shot, One Talk – 中科大联合香港理工推出的动态图像生成技术

One Shot, One Talk是先进的图像生成技术，能从单张图片中生成具有个性化细节的全身动态说话头像，支持逼真的动画效果，包括自然的表情变化和生动的身体动作。One Shot, One Tal...

AI项目框架 #

6个月前

0240

MagicPose – AI视频生成模型，能生成逼真的人体动作和面部表情

MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型，无需任何微调，直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略，分离人体动作和外观特征，实现了在...

AI项目框架 # # AI

8个月前

0230

VITA – 腾讯推出的开源多模态AI模型

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型（MLLM），能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型，扩展了中文词汇量，进行了双语指令微调，支持自然人机交互，无...

AI项目框架 #

8个月前

0230

VisionFM – 通用眼科AI大模型，具备少样本多种疾病诊断能力

VisionFM（伏羲慧眼）是多模态多任务的视觉基础模型，专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像，覆盖广泛的眼科疾病、成像模态、设备和人群统计数据。Vis...

AI项目框架 # # AI

6个月前

0220

video-analyzer – AI 视频分析工具，提取视频关键帧、生成视频详细描述

video-analyzer是开源的视频分析工具，结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容，并生成视频的详细描述。工具支持完全本地运行，无需云服务...

AI项目框架 # # AI

6个月前

0220

OmniParse – AI数据解析平台，提取和解析任何非结构化数据

OmniParse是数据解析平台，将非结构化数据转换为结构化、可操作的数据，优化适用于GenAI（大型语言模型）应用。OmniParse支持约20种文件类型，包括文档、表格、图像、视频、音频和网页，提...

AI项目框架 # # AI

6个月前

0210

NSFW Detector – 开源 AI 不适宜内容检测工具，支持识别图像、PDF、视频文件

NSFW Detector（Not Safe For Work，简称 NSFW）是开源的检测不适宜内容工具，NSFW Detector能识别图像、PDF、视频文件中的不适宜内容。工具基于Google的...

AI项目框架 #

6个月前

0210

Vanna – 开源AI检索生成框架，自动生成精确的SQL查询

Vanna是开源的Python RAG（Retrieval-Augmented Generation）框架，能帮助用户基于大型语言模型（LLMs）为其数据库生成精确的SQL查询。Vanna用两步简单流...

AI项目框架 # # AI

6个月前

1210

从安装到发布的9个WordPress完整建站流程解析

本文详细解析了从零开始使用WordPress建立完整网站的9个关键步骤。首先介绍了WordPress作为全球最受欢迎CMS的优势，包括开源免费、易用性强等特点。随后分步指导：从选择适合的托管方案（共享...

AI工具 AI快讯

2个月前

0200

LogoCreator – 开源 AI Logo生成器，几秒内创建专业级定制化商标

LogoCreator是开源的logo生成器，基于Together AI提供的Flux Pro 1.1技术快速创建专业风格的logo。项目用Next.js和TypeScript构建应用框架，Shadc...

AI项目框架 # # AI

6个月前

0200