Agent TARS – 字节开源的多模态 AI 代理工具

Agent TARS 是字节跳动开源的多模态 AI 代理工具。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和...
4周前
010

SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频,能重建出详细的 3D 场景布局,标注出房间结构、家具摆放、通道宽度等信息...
4周前
060

微信又有大动作,内测新功能上线!

微信又有大动作啦! 日前,微信派官宣「视频号直播」正在内测「K 歌房」功能,这一消息瞬间在社交圈引发了热议。 微信K歌功能玩法比较简单,11 月 12 日晚上 8 点 - 10 点,进入任意 K 歌房...
5个月前
0310