Claude AI模型被曝性能骤降,遭用户抵制

风头正劲的人工智能公司Anthropic正面临一场前所未有的用户信任危机。近日，该公司旗下明星AI模型Claude被大量开发者和重度用户指控性能出现"断崖式下跌"，引发社交媒体上的集中声讨和用户抵制潮。这场风波让这家估值高达3800亿美元、据传正在筹备IPO的AI独角兽措手不及，也为整个人工智能行业敲响了一记警钟。

PART 01

"降配"风波：从编程利器到"AI玩具"

事件的导火索来自AMD人工智能高级总监斯特拉·劳伦佐在GitHub上发布的一份重磅分析报告。劳伦佐对6852个Claude Code会话文件中的17871个思考模块与234760次工具调用进行了量化分析，时间跨度从今年1月底至4月初，数据详实、论据充分。

报告指出，Claude从2月底开始，从"研究优先"模式——先充分理解上下文再修改代码——退化为更粗暴的"编辑优先"模式。调整后的模型在执行操作前读取的上下文信息大幅减少，出错率显著上升，且频繁需要用户人工干预。更令人不安的是，模型还出现了提前终止任务、推卸责任、无意义征求用户许可等异常行为。

劳伦佐在报告中直言不讳："Claude Code在2月份更新后，已无法胜任复杂的工程任务。"

这一结论在开发者社区引发强烈共鸣。多位开发者在GitHub和Reddit上纷纷留言，表示遭遇了相同的问题。微软首席研究经理季米特里斯·帕帕伊洛普洛斯也在X平台发文称：

"过去两周，Claude Code的使用体验令人极其沮丧。即便我已经将推理努力度调至最高，它仍极其粗心，忽略指令，反复出错。"

网红开发者Om Patel甚至指出，Claude Opus 4.6的"思考量比以前少了三分之二"。更有多位开发者直言："感觉像在用一年前的Claude。"

PART 02

真相浮出水面：暗中调低"推理努力度"

面对铺天盖地的投诉，Claude Code产品负责人终于在GitHub和论坛上做出公开回应。他承认，Anthropic确实于3月3日将Claude默认的"推理努力程度"从高等级下调至"中等"（强度值85），目的是"减少每次请求消耗的Token数量，从而优化整体推理成本"。

简单来说，Token消耗与算力成本直接挂钩。单次任务处理的Token量越大，消耗的算力就越高。Anthropic此举的本质，是在用户不知情的情况下，通过削减模型的思考深度来降低运营成本。

产品负责人辩称这一调整"基于用户反馈"——此前有部分用户认为Claude消耗Token过多——并声称已通过Claude Code界面内的弹窗提示了用户。然而，大量用户反驳称，该公司进行如此重大的机制调整时并未做出充分、明确的披露。

对于一直以"更透明、更符合用户利益"作为品牌形象的Anthropic而言，此次被指"暗箱操作"无疑是致命打击。

PART 03

算力瓶颈：增长背后的隐忧

业界普遍猜测，Anthropic正面临严重的算力瓶颈。尽管过去几个月其产品需求呈爆发式增长——日活用户从400万涨至1100万，年化经常性收入已达300亿美元——但该公司官宣的数十亿美元级数据中心扩容协议数量，远不及OpenAI等竞争对手。

种种迹象印证了这一猜测：近期Anthropic多次出现服务中断，并在高峰时段实施更严格的使用限制。CNBC曝光的一份OpenAI内部备忘录甚至直言，Anthropic未能获取充足的算力资源是一项"战略失误"。

与此同时，Anthropic上周宣布已训练出名为Mythos的新模型，性能远超旗舰Opus系列。但公司以"安全考量"为由暂不发布，且该模型运行成本和算力消耗更高，进一步加剧了外界对其算力资源短缺的质疑。

业内研究总监表示："这本质上是算力和成本问题。复杂的工程任务需要消耗大量计算资源，随着使用量的攀升，系统已无法为每一个请求维持如此高强度的算力投入。"

PART 04

成本与性能的两难抉择

事实上，随着"代理式"人工智能系统的市场需求增速远超基础设施的扩容速度，整个AI行业都面临着GPU成本高企和数据中心扩展受限的困境。AI企业不得不在产品优先级上做出艰难取舍——是保证少数重度用户的极致体验，还是让更多用户获得"够用"的服务？

行业分析师指出："发生变化的不仅是输出质量，还有系统在生成输出过程中的行为方式。从审慎的逐步推理到更快速、更被动的执行——这种漂移清晰可见。工程师不得不更频繁地介入，最终亲自承担本应由系统处理的思考工作。"

产品负责人表示，作为补救措施，公司计划测试为团队版和企业版用户默认提供更高推理强度设置，以便用户获得更深入的推理结果，即便这会消耗更多Token并产生响应延迟。同时，旗舰模型Claude Opus 4.6已引入"自适应推理"功能，允许模型根据任务复杂度自主决定推理力度。

PART 05

信任危机：品牌声誉面临考验

对于正在筹备IPO的Anthropic来说，这场风波来得实在不是时候。过去几年间，Anthropic凭借技术实力和安全理念，在开发者和企业用户中积累了良好的口碑，甚至在与美国国防部的争端中赢得大量消费者支持。

然而，用户信任一旦受损，修复起来远比失去时困难得多。如果性能问题持续发酵，加之透明度不足的质疑不断升级，不仅有损其辛苦建立的品牌口碑，更可能在IPO的关键窗口期让投资者望而却步。

正如劳伦佐在GitHub分析中所言，她已暂时放弃Claude Code，转而使用竞品。虽然她对Anthropic自我纠偏仍持乐观态度，但也建议公司推出高级付费层级，让有需求的用户为更强的推理算力买单。

这场"降配"风波给所有AI企业敲响的警钟是：在追求商业增长的道路上，技术透明和用户信任永远是不可逾越的底线。当企业选择在暗处动刀子时，用户的脚投票终将不会缺席。