星火医疗大模型X1 - 讯飞医疗推出的深度推理大模型 星火医疗大模型X1是科大讯飞发布的深度推理大模型,专门针对医疗领域设计,具备强大的复杂问题处理能力。模型通过深度推理算法,能逐步解释循证过程,显著降低医疗幻觉问题,提升医疗场景推理的逻辑性和专业性。 AI项目框架 2周前010
story-flicks - AI视频生成工具,一键生成高清故事短视频 story-flicks 是基于AI大模型的项目,支持一键生成高清故事短视频。用户输入故事主题后,系统基于AI技术生成包含图像、文本、音频和字幕的短视频。story-flicks 项目支持多种模型提供... AI项目框架# # AI 2周前020
CSM - Sesame团队推出的对话语音模型 CSM(Conversational Speech Model)是Sesame团队推出的新型语音对话模型,提升语音助手的自然度和情感交互能力。CSM基于多模态学习框架,结合文本和语音数据,用Trans... AI项目框架 2周前020
AgiBot Digital World - 智元机器人推出的机器人仿真框架 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital World集成海量逼真的三维资产、多样化的专家轨... AI项目框架 2周前020
LuminaBrush - AI光源绘制工具,手绘光影线条自动生成光影效果 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像转换为“均匀照明”的外观,第二阶段根据用户涂鸦生成具体的照明... AI项目框架 2周前020
HumanOmni - 阿里通义等推出专注人类中心场景的多模态大模型 HumanOmni 是专注于人类中心场景的多模态大模型,视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入,能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预... AI项目框架 2周前020
ViDoRAG - 通义联合中科大、上交大推出的视觉文档检索增强生成框架 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理,解决传统方法在处理复杂视觉文档时的检索和推理局限性。ViDoRAG用... AI项目框架# 2周前040
Shandu - AI研究工具,自动进行多层次信息挖掘和分析 Shandu 是开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。Shandu 的核心功能包括递归探索... AI项目框架# # AI 2周前020
LCVD - 川大推出的可调节光照效果的肖像动画生成框架 LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征(如身份和外观)与外... AI项目框架 2周前020
SepLLM - 基于分隔符压缩加速大语言模型的高效框架 SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型(LLM)的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率。SepLLM的核心是利用分隔符(如... AI项目框架# 2周前020