Marco-o1 - 阿里推出的开源AI推理模型

Marco-o1是阿里巴巴国际数字商业集团MarcoPolo团队开发的开源AI推理模型,旨在解决开放式问题,缺乏明确答案和量化奖励的问题。模型通过链式思考(CoT)微调、蒙特卡洛树搜索(MCTS)和反...
2个月前
020