One Shot, One Talk – 中科大联合香港理工推出的动态图像生成技术 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作。One Shot, One Tal... AI项目框架# 6个月前0240
MagicPose – AI视频生成模型,能生成逼真的人体动作和面部表情 MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型,无需任何微调,直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略,分离人体动作和外观特征,实现了在... AI项目框架# # AI 8个月前0230
VITA – 腾讯推出的开源多模态AI模型 VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了双语指令微调,支持自然人机交互,无... AI项目框架# 8个月前0230
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、成像模态、设备和人群统计数据。Vis... AI项目框架# # AI 6个月前0220
video-analyzer – AI 视频分析工具,提取视频关键帧、生成视频详细描述 video-analyzer是开源的视频分析工具,结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容,并生成视频的详细描述。工具支持完全本地运行,无需云服务... AI项目框架# # AI 6个月前0220
OmniParse – AI数据解析平台,提取和解析任何非结构化数据 OmniParse是数据解析平台,将非结构化数据转换为结构化、可操作的数据,优化适用于GenAI(大型语言模型)应用。OmniParse支持约20种文件类型,包括文档、表格、图像、视频、音频和网页,提... AI项目框架# # AI 6个月前0210
NSFW Detector – 开源 AI 不适宜内容检测工具,支持识别图像、PDF、视频文件 NSFW Detector(Not Safe For Work,简称 NSFW)是开源的检测不适宜内容工具,NSFW Detector能识别图像、PDF、视频文件中的不适宜内容。工具基于Google的... AI项目框架# 6个月前0210
Vanna – 开源AI检索生成框架,自动生成精确的SQL查询 Vanna是开源的Python RAG(Retrieval-Augmented Generation)框架,能帮助用户基于大型语言模型(LLMs)为其数据库生成精确的SQL查询。Vanna用两步简单流... AI项目框架# # AI 6个月前1210
从安装到发布的9个WordPress完整建站流程解析 本文详细解析了从零开始使用WordPress建立完整网站的9个关键步骤。首先介绍了WordPress作为全球最受欢迎CMS的优势,包括开源免费、易用性强等特点。随后分步指导:从选择适合的托管方案(共享... AI工具AI快讯 2个月前0200
LogoCreator – 开源 AI Logo生成器,几秒内创建专业级定制化商标 LogoCreator是开源的logo生成器,基于Together AI提供的Flux Pro 1.1技术快速创建专业风格的logo。项目用Next.js和TypeScript构建应用框架,Shadc... AI项目框架# # AI 6个月前0200