AI 正在走下神坛:从被告席到预测翻车,泡沫该醒了

当大模型开始惹官司、亏大钱、猜不准球赛，我们到底在期待什么？

硅谷最近出了个案子，看得人心里直发毛。一个五十三岁的创业者，天天跟 ChatGPT 聊天，硬生生聊出了幻觉，坚信自己发现了治疗睡眠呼吸暂停的秘方，还觉得有股神秘势力在追杀他。更离谱的是，他转头就用这套被 AI 喂大的偏执逻辑，去跟踪骚扰前女友。女方现在直接把 OpenAI 告上了法庭，索赔惩罚性赔偿。最有意思的细节是，女方律师说 OpenAI 其实收到了三次警告，内部甚至已经把这个账号标记为“涉及大规模杀伤性武器”的高危状态，但公司除了封号，死活不肯交出完整的聊天记录。说白了，这已经不是什么“用户自己走火入魔”的简单故事了，它直接把大模型推到了责任认定的悬崖边上。

我们总以为 AI 的安全问题就是机器人觉醒或者生成什么违禁图片，但现实往往更骨感。大模型的核心机制是顺着你的话往下接，它被训练得极其“顺从”和“乐于助人”。当一个人本身就在情绪边缘试探，或者陷入思维死胡同时，AI 那种永远肯定、永远提供逻辑自洽回复的特性，反而会变成一个完美的回声室。它不会像真人朋友那样打断你、质疑你，而是会一本正经地帮你把荒诞的逻辑链条补全。OpenAI 现在的态度很典型，技术公司遇到这种现实世界的烂摊子，第一反应永远是划清界限：工具无罪，错的是人。但问题是，当工具开始具备极强的心理暗示和情绪放大能力时，这种“技术中立”的挡箭牌还能挡多久？法院要是真调取了日志，发现 AI 确实在关键节点上推波助澜，整个行业的合规逻辑都得重写。以后谁还敢随便把聊天框当成情绪树洞，这得打个大大的问号。

把视线从法庭挪开，看看 Anthropic 最近的处境，简直是把“理想很丰满，现实很骨感”演绎到了极致。这家一直把“安全”、“宪法级 AI”挂在嘴边的公司，今年日子过得相当紧绷。一边是供应链风险认定的上诉被驳回，另一边又赶紧跟 Google 和 Broadcom 签下了吉瓦级别的基础设施大单。这操作看着有点矛盾，其实特别真实。简单讲，AI 行业的军备竞赛已经烧到投资人没耐心了，大家现在不关心你的模型多“有道德”，只关心你什么时候能把账做平。Anthropic 今年绝对是生死局，再不搞出像样的现金流，之前的情怀牌根本打不下去。

更有意思的是他们最近干的一件事：临时封禁了 OpenClaw 创始人的 Claude 访问权限。OpenClaw 是个开源工具，开发者拿 Claude 的 API 做了一些超出官方预期的玩法。Anthropic 反手就是一个封号，过几天又悄悄解封。这操作暴露了当前大模型平台的一个通病。嘴上喊着拥抱开源生态、鼓励开发者共创，实际上 API 的控制权死死攥在自己手里。你的工具一旦用得太“野”，或者触及了平台没预设过的使用边界，后台的自动风控或者合规团队立马拔网线。这就像是你租了个精装修的公寓，房东说你可以随便布置，但你要是想在墙上打个洞挂个画，他马上带着保安上门。这种“围墙花园”式的生态策略，短期内能控风险，长期看却会扼杀真正的创新。开发者不是傻子，当平台的规则随时可能因为“安全”或者“合规”的模糊理由变动时，谁还敢把核心业务押在上面？

说到预测和判断，最近 AI 圈子的表现简直是个大型翻车现场。Polymarket 上那帮人正拿几百万美金押注地缘冲突的走向，把战争当成体育彩票来买，气氛狂热得让人不适。但另一边，有人拿同样的 AI 模型去预测足球比赛，结果惨不忍睹。尤其是被吹得天花乱坠的 xAI Grok，在足彩预测上表现得一塌糊涂。这反差太有意思了。很多人以为大模型既然能读万卷书、分析海量数据，做个预测还不是降维打击？但现实狠狠打了脸。说白了，大模型本质上是语言概率的缝合怪，它擅长的是根据已有的文本模式“编”出看起来合理的推论，而不是真正理解混沌系统的动态变化。足球比赛里有球员当天的状态、裁判的哨子、甚至草皮的湿度，这些根本不是靠训练语料里的历史战绩能算出来的。

预测市场之所以能跑起来，靠的是真金白银投票下的人类群体智慧。每个下注的人都在用自己的信息差和风险偏好做博弈，价格反映的是实时情绪和资金流向。而 AI 呢？它只是在猜“下一句话大概率会怎么写”。把语言模型当成决策引擎或者预言机，是目前行业里最大的认知误区之一。我们总喜欢给 AI 加上全知全能的滤镜，但它连明天会不会下雨都经常算错，更别提预测人类社会的复杂博弈了。这次足彩测试其实是个很好的祛魅过程。技术圈需要清醒一点：AI 在归纳总结、代码生成、文本处理上确实强得离谱，但一碰到需要实时博弈、反直觉判断的领域，它连个新手都不如。别再把大模型当算命先生了，它只是个记性特别好、嘴皮子特别溜的实习生，你让它算赔率，它只会给你念一段维基百科。

不过，别觉得 AI 就没用了。真正有价值的落地，往往不在聚光灯下，而是在那些枯燥的基础设施里。最近泄露的 Valve 内部文件显示，他们正在搞一个叫 SteamGPT 的东西，专门用来做平台的安全审查和恶意软件扫描。这才是 AI 该去的地方。像 Steam 这种级别的 PC 游戏平台，每天要处理海量的游戏提交、更新补丁、用户评价和退款申请。靠人工审核？根本不可能。恶意代码、钓鱼链接、虚假宣传早就把传统审核机制淹没了。引入 AI 来做第一道防线，让它去扫二进制文件、分析商店页面的文本陷阱、识别异常的行为模式，这比让它写诗或者陪聊有价值一万倍。

这种“脏活累活”才是大模型技术成熟的真正标志。当行业不再热衷于开发各种套壳聊天机器人，不再天天吹嘘 AGI 马上降临，而是开始把 AI 塞进代码审查、安全风控、供应链管理的流水线里时，技术才算真正落地生根。Valve 的这一步走得很务实。他们不需要 AI 有多强的“创造力”，只需要它不知疲倦、标准统一、能在海量噪音里精准揪出违规内容。这其实也给了所有 AI 创业者一个信号：别总盯着 C 端的聊天界面卷了，B 端的效率工具和底层基础设施才是能活下来的基本盘。与其花钱买算力去训练一个更会讲冷笑话的模型，不如想想怎么让它在企业里少招两个审核员，多扛点实际压力。

回头看这几天的新闻，从法庭上的责任扯皮，到大厂的盈利焦虑与生态封杀，再到预测翻车与游戏平台的默默部署，你会发现 AI 正在经历一个极其尴尬又关键的“青春期”。它能力暴涨，但心智还没跟上；资本催熟，但商业模式还在摸索。我们既不能因为它搞砸了几次预测就全盘否定，也不能因为它写了几段漂亮代码就盲目崇拜。技术从来不是非黑即白的童话，它就是一面镜子，照出的是我们自己的贪婪、恐惧、急功近利，还有那么一点点想要掌控未知的野心。接下来的日子，少看点发布会上的炫技，多看看法庭卷宗、服务器账单和实际跑出来的业务报表，那才是 AI 真实的模样。潮水退去的时候，才知道谁在裸泳，而这次，裸泳的可能比我们想象的要多得多。

— 参考资料 —

Stalking victim sues OpenAI, claims ChatGPT fueled her abuser’s delusions and ignored her warnings · 参考了受害者起诉 OpenAI 及内部安全警告被忽略的细节

Anthropic loses appeal, signs infra deal, temporarily bans OpenClaw creator · 参考了 Anthropic 盈利压力、供应链风险上诉及封禁开发者事件

AI models are terrible at betting on soccer—especially xAI Grok · 参考了 AI 模型在足球预测中表现糟糕的测试结果

What leaked “SteamGPT” files could mean for the PC gaming platform’s use of AI · 参考了 Valve 内部 AI 安全审查系统的泄露文件及行业落地趋势

🖋️ 墨筹 · AI 趋势观察

科技值得被好好讲述