乐于分享
好东西不私藏

从豆包虚假预约乌龙事件,谈AI自主操作手机APP实践

从豆包虚假预约乌龙事件,谈AI自主操作手机APP实践

近期一则网络新闻引发热议:网友用豆包“预订”餐厅,到店被告知“你找豆包预约那你找豆包啊”后怒给差评!客服:部分用户电话预约困难,误将AI模拟信息视为有效凭证事后豆包官方客服明确说明,平台并不具备商品购买、线下预约等实操能力。这场AI虚假预约的乌龙事件,暴露出当前通用人工智能普遍存在的落地短板。

目前市面上常见AI app产品中,千问可以实现阿里生态内AI外卖、AI打车等实操功能,能够在真实场景中为用户完成闭环服务。时至今日,人工智能早已不再局限于文字问答、知识解答等基础能力。用户对于AI的核心诉求,已经转向真实世界的场景交互,期待人工智能能够承担执行任务的角色,成为可落地、可实用的个人生活助理。

基于订餐、外卖、出行等高频生活场景,可运用openclaw+Open-AutoGLM等工具,搭建了一套通用型AI执行方案。不同于平台产品局限于单一生态的特点,这套方案不绑定特定厂商应用,基本可适配操作手机大部分软件。

整套方案的核心思路简洁高效:为人工智能配置独立的操作终端。通过专属手机作为执行载体,AI可根据指令独立完成各项手机操作,全程不占用、不干扰个人主力设备。在AI自主处理任务的过程中,个人设备可正常使用,互不冲突。

智谱开源的Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。

部署方式也十分简单,把这句话发给你的龙虾或者爱马仕即可:

访问文档,为我安装 AutoGLM

https://raw.githubusercontent.com/zai-org/Open-AutoGLM/refs/heads/main/README.md

模型实操能力出众,且本地部署硬件门槛较低,同时官方开放免费在线API接口,适配个人开发与测试场景。完成模型部署后,再将设备接入OpenClaw,实现了远程调度能力。这样即便身处室外,也可通过微信远程指令,调度本地设备完成各类手机操作任务。

下达指令后,openclaw指挥手机全程自主操作,打开美团,搜索并完成预订。

已关注

关注

重播 分享

回望此次AI预约乌龙事件,这套方案,恰好解决了传统AI”只能问答、不能执行”的痛点。部署后可随时通过微信、飞书随时下发指令,调度本地OpenClaw终端,自主打开美团等生活服务平台,完成餐厅预订、外卖点单、线上支付等全流程操作,形成完整的服务闭环。

实现了人工智能与物理世界的深度交互,让AI从虚拟的问答工具,向具备实际执行能力的智能助理前进了一小步。

在整理本次实践内容的过程中,刚好看到中国移动官方发布的云手机推广方案。云手机与人工智能的结合,可将整套本地实操流程迁移至云端,摆脱对本地硬件设备的依赖,或将成为运营商人工智能业务新的发展方向与增长赛道。

无独有偶,近期国家人工智能应用中试基地(具身智能)在杭州正式揭牌启用,无论是工业场景中的机器人、机器狗智能作业,还是民用场景下的手机自主操作、智能家居联动,本质都是具身智能与物理世界的融合落地。这也是人工智能技术突破虚拟交互、赋能实体场景、提升生产效率与生活服务质量的核心发展方向。