Cerebellum - 浏览器AI助手,完成网页自动化任务和行动规划

AI工具5个月前发布 AI工具
14 0 0

什么是Cerebellum?

基于Claudellum的Cerebelum 3.5 Sonnet和Selenium Webdriver构建的浏览器AI智能助手可以理解任务意图,执行网页自动化任务,如数据捕获和网站自动化测试。cerebellum将网页浏览简化为向图导航,用LLM分析页面内容和交互元素,智能规划行动路径,根据网页状态和历史操作动态调整策略。cerebellum支持多浏览器,可以准确模拟用户行为,适用于复杂的自动化场景。

Cerebellum的主要功能

  • 图形导航:将网页浏览简化为向图导航,将每个网页视为节点,用户操作(如点击或输入)作为节点之间的边缘。
  • 节点发现:分析基于LLM(大型语言模型)的页面内容,发现和识别新的网页节点。
  • 行动决策:智能决策下一步行动是基于当前网页状态和历史用户操作。
  • 支持多浏览器:与Chrome兼容、Firefox、各种浏览器,如Safari和Edge。
  • 模拟用户行为:适用于复杂的自动化场景,准确模拟用户行为,如点击、输入等。
  • 调整动态策略:根据实时反馈动态调整浏览策略和操作,接受操作指令。
  • 表单填写:自动填写用户提供的JSON数据的网页表单。

cerebellum的技术原理

  • 网页模型化:将网页浏览过程模型化为有向图,每个网页都是节点,用户操作是节点之间的连接边。
  • LLM集成:集成大型语言模型(LLM),比如Claude 3.5 Sonnet,分析网页内容和交互元素,识别和规划新节点。
  • 状态分析:LLM根据当前的网页状态和历史操作数据决定下一步的最佳行动。
  • 行动执行和反馈:Cerebelum执行LLM规划操作,并将操作后的新网页状态反馈给LLM,以便做出下一步决策。
  • 目标导向:从网页开始,目标是到达代表任务完成的目标节点。
  • 自动化流程:用户设定目标,Cerebellum自动处理繁琐的脚本录制和执行,实现自动化任务。
  • 环境集成:与Selenium 基于Selenium的浏览器驱动能力,WebDriver紧密集成,实现跨浏览器的自动化操作。

Cerebellum项目地址

Cerebellum的应用场景

  • 网站自动化测试:实施网页功能测试,自动测试脚本,确保网站或Web应用程序的各种功能按预期工作。
  • 数据捕获与分析:在市场研究、竞争对手分析或数据聚合服务中,自动化从网页上捕获数据。
  • 网页内容管理:自动更新文章、发布博客、管理用户评论等管理网站内容。
  • 电子商务:订单、库存管理、价格比较、产品信息更新等任务的自动化处理。
  • 自动化客户服务:回答自动聊天机器人或客户支持系统中常见的问题,提高客户服务效率。
© 版权声明

相关文章

暂无评论

none
暂无评论...