CogView3 – 智谱AI推出的开源AI图像生成模型

CogView3是清华大学联合智谱AI推出的开源AI图像生成模型,采用中继扩散技术。模型分阶段生成图像,首先创建低分辨率图像,然后通过中继超分辨率技术提升至高分辨率,提高生成效率并降低成本。CogVi...
7个月前
01610

Gemini Live – 谷歌推出的多模态AI语音助手

Gemini Live是谷歌推出的智能语音助手,具有自然语言理解和多模态识别能力,支持图像、视频和语音交互。用户可通过语音指令控制,实现日常任务自动化。Gemini Live提供10种语音选择,集成谷...
7个月前
01600