UniBench – Meta推出的视觉语言模型(VLM)评估框架 UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架,对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试,涵盖物体识别、空间理解、推理等多维度能力。 AI项目框架# # AI 7个月前060
Retinex-Diffusion – AI图像照明控制框架,让图像明暗更自然、细腻 Retinex-Diffusion是基于Retinex理论的AI图像照明控制技术,让图像明暗更加自然、细腻、富有层次感。Retinex-Diffusion不需要重新训练模型,通过识别图像中的光照元素并... AI项目框架# # AI 7个月前090
ReSyncer – 清华联合百度推出的AI视频编辑工具 ReSyncer是清华大学和百度联合推出的AI视频编辑工具,通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模型,结合目标视频生... AI项目框架# # AI 7个月前0750
Mini-Monkey – 华科联合华南理工推出的多模态AI模型 Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效解决了传统图像切分带来的锯齿效应,提升了在高分辨率图... AI项目框架# # AI 7个月前080
Falcon Mamba 7B – 首个通用Mamba开源AI大模型 Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意力... AI项目框架# # AI 7个月前090
UniTalker – 商汤推出的音频驱动3D面部动画生成模型 UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音频类型的处理,包括语音和歌曲。 AI项目框架# 7个月前0120
MagicPose – AI视频生成模型,能生成逼真的人体动作和面部表情 MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型,无需任何微调,直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略,分离人体动作和外观特征,实现了在... AI项目框架# # AI 7个月前0220
UniPortrait – 阿里推出的AI人像图像个性化编辑工具 UniPortrait是阿里巴巴推出的AI图像个性化编辑工具,能将照片转换为动漫风格,支持多人合照和换脸技术。UniPortrait通过先进的"ID嵌入"和"ID路由"技术,在多人合照中也能准确识别和... AI项目框架# # AI 7个月前0960
HumanVid – 专为人类图像动画生成而设计的高质量数据集 HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行... AI项目框架# 7个月前0170
HoloDreamer – AI文本驱动3D场景生成框架 HoloDreamer是北京大学联合鹏城实验室推出的AI文本驱动3D场景生成框架。通过两个核心模块:风格化全景图生成和增强两阶段全景图重建,从文本描述中快速生成沉浸式、视角一致的全封闭3D场景。 AI项目框架# # AI 7个月前0100