Agent TARS – 字节开源的多模态 AI 代理工具

Agent TARS 是字节跳动开源的多模态 AI 代理工具。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和...
3个月前
010

SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频,能重建出详细的 3D 场景布局,标注出房间结构、家具摆放、通道宽度等信息...
3个月前
070

微信又有大动作,内测新功能上线!

微信又有大动作啦! 日前,微信派官宣「视频号直播」正在内测「K 歌房」功能,这一消息瞬间在社交圈引发了热议。 微信K歌功能玩法比较简单,11 月 12 日晚上 8 点 - 10 点,进入任意 K 歌房...
8个月前
0660

盘点一周AI大事(2024.11月10日)

盘点一周AI大事(11月10日) 川普废除AI监管 盘点一周A大事OpenAl两周内发布Sora,年底推出o2, 奥特曼称明年会实现AGI斯坦福最新研究, GPT4具有6岁儿童心智 川普承诺废除拜登的...
8个月前
0790