一个极具魔幻现实反差的冰冷切片是:在某二手交易平台上,刚刚衍生出一种标价 150 元的全新黑产服务——“无残留代客卸载龙虾(OpenClaw)”。仅仅在 72 小时前,这只代号为“龙虾”的开源 AI 代理(Agent)还是整个互联网和职场圈子的绝对顶流。“让 AI 接管鼠标”、“睡一觉醒来研报已经写好”、“最后一次亲手点开 Excel”之类的短视频切片,像兴奋剂一样精准注射进了每一个深患“效率焦虑”的打工人的静脉里。所有人都以为,传说中的“超级个体”时代终于在 2026 年初准时敲门了。结果是,门推开,进来的是一个瞎着眼、算不清楚账、还在你家里乱砸东西的吞金兽。根据权威开发者社区最新流出的非正式统计,高达四成的早期使用者在安装三天内执行了卸载。与之对应的是一份更残酷的实验室测试数据:在当前最严苛的“计算机操作基准测试(CUB)”中,哪怕是顶尖大模型驱动的视觉操作代理,其真实复杂任务的无人工干预成功率,最高峰值也仅停留在 10.4%。这意味着,剩下的近九成时间里,它要么在原地打转,要么在给你的工作帮倒忙。当对“被淘汰”的恐惧转化为一地鸡毛的真实挫败感后,我们是时候把目光从华丽的演示视频移开,像解剖一头极其病态的庞然大物一样,切开“龙虾”的肚皮,看看里面到底装了什么。
一场用“概率猜测”接管“确定性”的架构灾难
我们要理解为什么龙虾会频繁做出“蠢事”,就必须把手伸进技术框架的最底层。打工人们对自动化工具的印象,大多停留在早期按键精灵或者企业 RPA(机器人流程自动化)的时代。那种工具很笨,它的逻辑是死板的坐标系和硬编码:找对应的网页元素,找到了就点,找不到就报错退出。它 100% 是一架冰冷、确定性的机器。但现在的 AI 代理走了一条截然不同的、甚至可以说是反常识的技术路线——用概率模型来强推确定性操作。你要知道,大语言模型(LLM)的本质永远是统计学层面的“下一个词的预测”。它所有的输出,都是基于百亿参数在多维空间中计算出的最高概率解。当你扔给龙虾一个诉求:“帮我把收件箱里昨天带发票附件的邮件,下载并整理到桌面”,它并不是在执行一段代码。它是在不断地对你的电脑屏幕进行高速截屏,将图像送进多模态视觉模型进行语义特征分析,然后“猜”出一个它认为成功率高达 95% 的点击坐标,接着操纵哪怕仅仅发生了微米级偏移的光标点下去。如果软件界面永远静止如一潭死水,这招或许有效。但现代操作系统的图形界面(GUI),是一个充满了“环境劫持”的地雷阵。一个突然弹出的杀毒软件右下角广告,微信闪动的新消息通知,或者仅仅是因为网速波动导致一个“确认”按钮晚出现了 0.5 秒。在人类眼里,这些是完全可以依靠常识自动忽略的“背景噪音”;但在依靠视觉感知的大模型眼里,环境完全被破坏了。这时候的龙虾,瞬间变成了一个在坐标系里迷失的盲人。它陷入了一种学界称为“忠实性幻觉”的黑洞:它坚信自己刚才的操作是对的,于是开始胡乱抓取屏幕上的其他元素试图弥补,接着引发连环的车祸。这就是为什么有人眼睁睁看着这只龙虾,在因为网卡没找到下载按钮后,反手点开了回收站,并诡异地清空了所有文件——在这场复杂的概率推演里,模型在某一层的注意力机制(Attention)彻底崩塌了。用一个千亿参数的高延迟模型,去干一次微秒级的鼠标确认,就像是为了一道西红柿炒鸡蛋,专门拉来了一帮量子物理学家去推导原子的裂变轨迹。这不是技术的一往无前,这是一种架构哲学上的傲慢与荒谬。
谁在买单?算力矿场与一笔倒挂的经济账
如果仅仅是笨一点,或许大家还有耐心陪它成长。但真正压垮互联网打工人的,是收到云服务商 API 账单的那一刻。在这场宣扬“解放双手”的造神运动中,一个最残酷的隐形成本被刻意隐瞒了。目前一个未经过极致优化的复杂任务,代理在背后的执行需要一个极其冗长且极其消耗算力的思维链条(Chain of Thought)。它需要思考计划、观察反馈、评估结果、甚至重试。这种不断来回的视觉问答(VQA),导致一次简单的多页表格数据抓取,其背后消耗的 Token 数量极其容易飙升突破 50,000 大关。行业预估的一个冰冷前瞻是,到今年年底,AI 的推理计算需求将是训练大模型本身需求的 4.5 倍。这是一个畸形的经济模型。如果你自己手动去翻阅网页、复制粘贴并填表,哪怕你因为加班而满腹牢骚,这套动作的实际边际成本也接近于零。但在龙虾的系统里,大模型每看一眼你的屏幕,都在云端的 GPU 阵列上燃烧着高昂的电费与折旧费。你省下来的 5 分钟,可能在 API 计费系统里被折算成了好几美金。互联网从业者本来是想找一个免费的奴隶,结果自己却变成了替模型厂商和云端平台填补算力黑洞的“提款机”。这里面的讽刺意味拉满:当大厂们在财报上高歌猛进、宣布算力需求再次引爆的时候,底层打工人却在为了一次失败的 Excel 自动透视表,支付着比买一杯星巴克还贵的服务器响应费。所谓的“超级个体”,在现阶段更像是一个被精心包装的消费主义陷阱。它精准收割了知识工作者们对“被 AI 淘汰”的深度恐惧。买单的,始终是那些试图用金钱和算力去换取虚假“闲暇时间”的焦虑者。
抛弃“拟人”执念:下一代赛博劳工的真实面孔
如果今天对龙虾的讨伐是一场必然,那 AI 代理真的只是一场骗局吗?未必。极客们的卸载,倒逼我们直面一个最本质的技术迷思:我们到底为什么非要让 AI 像个人类一样去移动鼠标?这简直就是“汽车刚发明时,为了安抚路人,非要在车头绑一个假马头”的经典重演。最初的软件图形界面(GUI),本来就是因为人类看不懂机器代码,为了迁就人类的碳基肉眼和低效的实体手指,才发明出来的妥协产物。现在,机器已经有了足够聪明的大脑(LLM),我们居然还要强迫它通过去识别那些为人类妥协的“图标”、“边框”和“色彩”,再去反向操作。真实能够落地、并且扛过严苛的工业级成本核算的赛博劳工,绝不长着龙虾这般试图抓取一切的钳子。下一代操作系统与应用生态,必然是一场 API-First(接口优先)的暗网重构。大模型不需要去“看”你的微信界面,不需要去“识别”那个发送按钮在哪里。应用本身应该对合法的 Agent 敞开结构化的数据通道。意图识别直接在底层通信协议中握手,一切动作在代码层面瞬间完成(Headless 模式)。没有误触,没有视觉漂移,幻觉被硬编码的 API 校验死死按在地上。最重要的是,Token 消耗将经历断崖式暴跌,从几美金的账单,缩水成万分之一。只是在那个时代到来前,我们要经历一段漫长的、充斥着劣质仿生玩具的泥泞期。