AtomThink – 华为诺亚方舟联合多所高校推出的多模态数学推理框架 AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维(CoT)引导多模态大型语言模型(MLLMs)进行复... AI项目框架# # AI 5个月前030
AlphaQubit – 谷歌推出的量子错误解码器 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别,助力量子计算机实现长时间、大规模的... AI项目框架# # AI 5个月前000
Samsung Gauss2 – 三星推出的第二代多模态生成式AI模型 Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型,能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和图像等多种数据类型。Samsung ... AI项目框架# # AI 5个月前020
CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统 CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的,计算机辅助设计(CAD)模型生成系统,根据用户的多种输入(如文本描述、图像、点云或这些输入的组合... AI项目框架# # AI 5个月前0340
LaTRO – 基于自我奖励提升LLMs复杂推理能力的框架 LaTRO(Latent Reasoning Optimization)是先进的框架,提升大型语言模型(LLMs)在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样,用变分推断方法进行优化... AI项目框架# 5个月前010
MagicClay – Adobe 推出的3D建模工具,文本引导3D模型局部雕刻 MagicClay 是 Adobe 推出3D建模工具,结合网格和有向距离场(SDF)技术,支持艺术家基于文本提示对3D模型的特定部分进行雕刻,同时保持模型的其他区域不变。MagicClay 支持生成具... AI项目框架# 5个月前000
ReCapture – 谷歌和新加坡国立大学共同推出的视频处理技术 ReCapture是谷歌和新加坡国立大学推出的视频处理技术,能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCapture用多视图扩散模型或基于深度的点云渲染生成带有新相机轨迹的噪声锚视频,采... AI项目框架# 5个月前010
StableV2V – 中国科技大学开源的视频编辑项目 StableV2V是中国科技大学推出的开源视频编辑项目,基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用形状一致的编辑范式,基于三个主要组件:Prompted First-frame ... AI项目框架# 5个月前000
Halo – 开源的DIY健康追踪项目,构建私人健康检测应用 Halo是开源的DIY健康追踪项目,基于低成本的智能戒指和开源软件,让用户构建自己的私人健康监测应用。Halo支持活动追踪、心率监测、睡眠分析等功能,且完全尊重用户隐私。基于Halo,用户能深入了解自... AI项目框架# 5个月前000
TIP-I2V – 超170万大规模真实文本和图像提示数据集 TIP-I2V是大规模真实文本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频。数据集能推动更好、更安全的图像... AI项目框架# 5个月前0110