SPAR – 智谱团队推出的自我博弈训练框架 SPAR是智谱团队推出的自我博弈框架,能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成者执行指令生成回复,完善者对回复进行分析和改进。SPAR基于树搜索技术精... AI项目框架# 5个月前020
Mind GPT-3o – 理想汽车推出的多模态端到端大模型 Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力,能提升用户认知、完成任务并提供情感支... AI项目框架# 5个月前0160
琅琊 – 中国科学院海洋研究所自主研发的海洋大模型1.0版本 琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本,专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科学知识,能实现对全球海洋状态变量的中短期高精度预报。 AI项目框架# 5个月前040
DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicControl通过自适应地选择不同条件... AI项目框架# # AI 5个月前060
InstructMove – 东京大学联合 Adobe 推出基于指令的图像编辑模型 InstructMove是东京大学和Adobe公司联合推出的基于指令的图像编辑模型,通过观察视频中的帧对变化学习如何根据指令进行图像操作。模型基于多模态大型语言模型(MLLMs)生成描述帧对之间变化的... AI项目框架# 5个月前070
MiniCPM-V – 面壁智能推出的开源多模态大模型 MiniCPM-V是面壁智能推出的开源多模态大模型,拥有80亿参数,擅长图像和视频理解。MiniCPM-V在单图像理解上超越了GPT-4V等模型,并首次支持在iPad等设备上实时视频理解。模型以高效推... AI项目框架# # AI 7个月前020
EXAONE 3.0 – LG 推出的开源 AI 模型,专为英语和韩语设计 EXAONE 3.0是LG AI Research推出的开源AI模型,具有7.8亿参数,专为英语和韩语设计。EXAONE 3.0在英语和韩语的语言测试中均表现优异,在真实用例和数学编码方面排名第一。 AI项目框架# # AI 7个月前020
DressCode – 上海科技大学推出的3D服装生成框架 DressCode是上海科技大学、宾夕法尼亚大学和Deemos科技联合推出的3D服装生成框架。支持用户通过文本描述来自动生成各种风格和材质的3D服装模型。 AI项目框架# 7个月前0170
MotionClone – 文本驱动的AI视频动作克隆框架 MotionClone是文本驱动的AI视频动作克隆框架,通过时间注意力机制从参考视频中克隆动作,结合文本提示词生成新视频。能处理复杂的全局相机运动和精细的局部肢体动作,实现高度逼真和控制性强的视频内容... AI项目框架# # AI 7个月前0170
ASAM – vivo公司推出的AI图像分割模型 ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI图像分割模型,通过对抗性调整来增强原有SAM模型的性能。ASAM用自... AI项目框架# # AI 7个月前010