Whisper-Medusa - aiOla推出的开源AI语音识别模型 Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Me... AI项目框架# # AI 2周前020
FoleyCrafter - 上海人工智能实验室推出的AI视频配音框架 FoleyCrafter是上海人工智能实验室和香港中文大学(深圳)共同推出的AI视频配音框架,FoleyCrafter能自... AI项目框架# # AI 2周前020
Qwen2-Audio - 阿里通义千问团队推出的开源AI语音模型 Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音... AI项目框架# # AI 2周前020
EAFormer - 复旦推出的AI文本分割框架 EAFormer是复旦推出的AI文本分割框架。擅长在照片中找到文字,并且能很精确地把文字从背景中分离出来。... AI项目框架# # AI 2周前020
VideoDoodles - Adobe推出的AI视频编辑框架 VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画,实现与... AI项目框架# # AI 2周前020
Retinex-Diffusion - AI图像照明控制框架,让图像明暗更自然、细腻 Retinex-Diffusion是基于Retinex理论的AI图像照明控制技术,让图像明暗更加自然、细腻、富有层次感。Ret... AI项目框架# # AI 2周前020
Mini-Monkey - 华科联合华南理工推出的多模态AI模型 Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略(MS... AI项目框架# # AI 2周前020
Cradle - 通用计算机控制的多模态AI Agent框架 Cradle是面向通用计算机控制(General Computer Control, GCC)的多模态AI Agent框架,由昆仑万维携手北... AI项目框架# # AI 2周前020
VideoPrism - 谷歌研究团队推出的通用视频编码器 VideoPrism是一个由谷歌研究团队开发的通用视频编码器,旨在通过一个单一的冻结模型来处理多种视频理解... AI项目框架# # AI 2周前010