admin管理员组

文章数量:1625848

这项成果来自阿里通义实验室Mobile-Agent的v2版本更新,具体来说,本次升级有三大亮点。

一句话让AI自动化操作手机,打个车已经不是难事了。

从官方公布的演示视频来看,用户只需要说出目的地,Agent就能够通过规划、决策和反思的流程自动化帮用户完成目的地输入,呼叫车辆等操作,适用于老人及视障人群,解决他们不会使用或者无法使用手机APP的问题。

这项成果来自阿里通义实验室Mobile-Agent的v2版本更新,具体来说,本次升级有三大亮点:

  • 首次在手机操作任务上采用多智能体架构,并延续了一代的纯视觉方案
  • 多智能体各司其职,实现了更有效的任务进度追踪、任务相关信息记忆和操作反思
  • 更强大的复杂指令拆解能力、跨应用操作能力和多语言场景操作能力

任务难度提升,v2也能搞定

首先我们关注一下Mobile-Agent-v2的演示效果。从作者团队发布的演示视频来看,Mobile-Agent-v2能够完成的任务难度相比于Mobile-Agent有明显的提升。下面将展示部分演示

本文标签: 也能手机句话开源打车