乐于分享
好东西不私藏

百度腾讯官宣AI Agent新应用:跨App操作+云端虚拟手机,打工人的手替来了?

百度腾讯官宣AI Agent新应用:跨App操作+云端虚拟手机,打工人的手替来了?

以前想让手机帮忙干点杂活,最多就是问问天气、设个闹钟。要是跟它说“帮我点杯咖啡”“订张去长沙的便宜机票”,大概率只会弹出一堆搜索结果,还得自己一个个点开操作。但最近几天,两家大厂几乎前后脚放出来的新工具,可能真要改变这个局面了——手机里开始住进一个能替你动手的“数字替身”。

百度这边动作很快,3月12号直接在安卓应用市场上线了叫“红手指Operator”的应用。这名字听着有点抽象,其实逻辑挺直接:它在云端给你造了一台虚拟手机,你本地装个App就能指挥那台云手机干活。你下达指令,比如“去美团点杯咖啡”,云手机里的AI Agent就会自己打开美团、选店、加购,最后到你确认支付那步再交回给你。这套能力结合了百度自研的移动端AI Agent和OpenClaw(一个能处理复杂任务的自动化工具),OpenClaw负责在网页端做信息搜集这类重活,Operator则专攻原生App里的操作,两者配合起来,跨App打车、订餐、甚至游戏挂机都能在云端自动跑。

腾讯那边也没闲着,3月9号推出的WorkBuddy走的是办公辅助路线,但内核同样是“听懂人话、自己动手”的智能体。它内置了超过20种技能包,生成海报、自动做报表这类事,发个指令就能在电脑桌面自动执行。有意思的是,WorkBuddy完全兼容OpenClaw的技能体系,国内版还能切换混元、DeepSeek、Kimi这些主流大模型。据说正式发布前,腾讯内部已经有超过2000名非技术员工在用这工具处理数据、写文案,帮HR筛简历、帮行政做自动化流程。

这类工具听起来很省心,但实际用起来和想象中还有点距离。我特意试了试“红手指Operator”,花58块买了月会员(免费体验名额已经抢光了)。下了几个指令后发现,它确实会自己滑动屏幕、打开应用、输入文字,每个步骤都有截图留底。但在关键环节,比如第一次打开App要同意权限、登录账号、确认隐私协议,统统需要我手动接管操作。百度云相关负责人解释,所有操作都在云手机桌面完成,相当于独立虚拟环境,不碰原始手机,信息安全有保障。但这意味着,指望它彻底放手不管,目前还做不到。

这里头其实藏着当前AI Agent的典型取舍:为了安全,必须把敏感操作(权限授权、账号登录、支付确认)卡在人类手里;但每次打断都需要用户手动接管,又让“全自动”体验打了折扣。群里已经有朋友吐槽:“这不就是云手机加了个自动化脚本吗?”话虽这么说,但仔细想,能跨App自主规划操作路径、识别屏幕元素、点击滑动一气呵成,背后已经是视觉理解、任务拆解、环境交互的综合能力。安全机制刻意留下“人为确认”这道坎,短期内看是必要的代价。

还有个现实问题是成本。“红手指Operator”会员58块一个月,对于偶尔用一用的人来说,可能得算算值不值。腾讯WorkBuddy倒是给了新用户5000 Credits的体验额度,先尝后买。不过话说回来,如果把时间成本算进去——比如每天要手动处理大量重复的订票、比价、数据抓取,这月费可能比一小时工时费还低。

接下来几个月,这类AI Agent应用估计会越来越多。百度版已经上了华为、小米应用商店,iOS端据说3月内也会来。腾讯WorkBuddy目前主攻办公场景,官网就能下。两个方向其实挺有意思:一个想做“生活手替”,帮你跑腿点餐比价;一个想做“办公副脑”,帮你写报表做海报。我倒是挺好奇,真用起来,你会把哪类杂事交给它?

先去官网薅个免费额度试试,反正不亏。试完记得回来评论区聊聊:你觉得这种“云端替身”,是能真正解放双手,还是噱头大于实用?

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 百度腾讯官宣AI Agent新应用:跨App操作+云端虚拟手机,打工人的手替来了?

猜你喜欢

  • 暂无文章