AI项目框架 | 第79页

UniBench – Meta推出的视觉语言模型(VLM)评估框架

UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架，对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试，涵盖物体识别、空间理解、推理等多维度能力。

AI项目框架 # # AI

7个月前

060

Retinex-Diffusion – AI图像照明控制框架，让图像明暗更自然、细腻

Retinex-Diffusion是基于Retinex理论的AI图像照明控制技术，让图像明暗更加自然、细腻、富有层次感。Retinex-Diffusion不需要重新训练模型，通过识别图像中的光照元素并...

AI项目框架 # # AI

7个月前

090

ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer是清华大学和百度联合推出的AI视频编辑工具，通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模型，结合目标视频生...

AI项目框架 # # AI

7个月前

0750

Mini-Monkey – 华科联合华南理工推出的多模态AI模型

Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效解决了传统图像切分带来的锯齿效应，提升了在高分辨率图...

AI项目框架 # # AI

7个月前

080

Falcon Mamba 7B – 首个通用Mamba开源AI大模型

Falcon Mamba 7B是阿联酋技术创新研究所（TII）推出的开源AI大模型，性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意力...

AI项目框架 # # AI

7个月前

090

UniTalker – 商汤推出的音频驱动3D面部动画生成模型

UniTalker是推出的音频驱动3D面部动画生成模型，能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型，用带有不同标注的数据集，支持多语言和多种音频类型的处理，包括语音和歌曲。

AI项目框架 #

7个月前

0120

MagicPose – AI视频生成模型，能生成逼真的人体动作和面部表情

MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型，无需任何微调，直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略，分离人体动作和外观特征，实现了在...

AI项目框架 # # AI

7个月前

0220

UniPortrait – 阿里推出的AI人像图像个性化编辑工具

UniPortrait是阿里巴巴推出的AI图像个性化编辑工具，能将照片转换为动漫风格，支持多人合照和换脸技术。UniPortrait通过先进的"ID嵌入"和"ID路由"技术，在多人合照中也能准确识别和...

AI项目框架 # # AI

7个月前

0960

HumanVid – 专为人类图像动画生成而设计的高质量数据集

HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集，专为人类图像动画训练设计。结合了现实世界视频和合成数据，通过精心设计的规则筛选高质量视频，并使用2D姿势估计和SLAM技术进行...

AI项目框架 #

7个月前

0170

HoloDreamer – AI文本驱动3D场景生成框架

HoloDreamer是北京大学联合鹏城实验室推出的AI文本驱动3D场景生成框架。通过两个核心模块：风格化全景图生成和增强两阶段全景图重建，从文本描述中快速生成沉浸式、视角一致的全封闭3D场景。

AI项目框架 # # AI

7个月前

0100