OpenClaw 最大的问题是什么
刚接触 OpenClaw 时,给我的感觉是惊喜的,很多意想不到的活突然能完成了。
但随着深入的使用,会想尝试让它干更多事,就越来越感到受阻。任务执行不下去、需要人接管、需要人协助。
你在使用 OpenClaw 的过程中,往往让你感到麻烦的地方,很多时候都是各个应用之间的不互通造成。
比如:
- 让它了解我记在 flomo 的想法
- 让它去小红书搜一些攻略
- 想整理的内容在腾讯会议的会议纪要里
- 把旅游攻略上的景点标注在地图 POI 上
这些都没有 API 无法直接完成,有些可以退回网页版,但可能会被反爬限制,而有些只能人工接入,或者要想各种方法绕过。
不是 AI 不够聪明,而是应用之间不互通。
这个问题,业界一直有各种方案提出,大致可以归成三条路线:
1. 标准化协议路线
目前业界共识的就是 MCP,本质上是让应用提供结构化接口,供模型调用。这种方式对 AI 最友好,数据结构化便于理解,速度也最快。但坏处是需要应用开发者主动适配,工作量大,短期内不可能全面覆盖。
2. 直接接管路线
类似 Browser Use 的方案,相当于以人的方式去操作网页。这种对模型来说并不高效,模型很多时候并不能一次就正确地点中目标,会来回不断尝试,所以需要消耗大量 token,也很慢。
3. 桥接适配路线
这是一种中间路线, 利用现有的应用,通过一种桥接的方式,让模型更高效地使用它。
Chrome 提出的 WebMCP 标准就是这个路线 ,能让模型知道当前网页有哪些服务,而不必去分析网页内容
这条路线也冒出了很多项目:parse.bot 帮你逆向出请求接口;Cli Anything 通过代码分析,把应用转成命令行工具;OpenCLI 则直接把常用应用逆向成 UI 操作流封装成 cli。
三条路线都在推进,但现实是:大多数应用没有接入 MCP,桥接在灰色地带,Browser Use 又太慢太贵。
不过,最近能感受到一些变化
滴滴提供了 MCP 接口,用 OpenClaw 接入非常简单。淘宝桌面客户端也开放了 MCP 接口,支持商品搜索、浏览详情、加购等
但生态要完善起来,还有很长的路要走,需要权衡利弊,这受商业模式影响。靠交易佣金赚钱的,和靠广告收入或流量分配权赚钱的,态度会不一样。
无论怎样,期待 Agent 真正平民化,成为个人数字助理的时刻。
夜雨聆风