当前时间: 1970-01-01 08:00:00
分类:办公文件
评论(0)
Claude AI模型被曝性能骤降,遭用户抵制风头正劲的人工智能公司Anthropic正面临一场前所未有的用户信任危机。近日,该公司旗下明星AI模型Claude被大量开发者和重度用户指控性能出现"断崖式下跌",引发社交媒体上的集中声讨和用户抵制潮。这场风波让这家估值高达3800亿美元、据传正在筹备IPO的AI独角兽措手不及,也为整个人工智能行业敲响了一记警钟。 事件的导火索来自AMD人工智能高级总监斯特拉·劳伦佐在GitHub上发布的一份重磅分析报告。劳伦佐对6852个Claude Code会话文件中的17871个思考模块与234760次工具调用进行了量化分析,时间跨度从今年1月底至4月初,数据详实、论据充分。 报告指出,Claude从2月底开始,从"研究优先"模式——先充分理解上下文再修改代码——退化为更粗暴的"编辑优先"模式。调整后的模型在执行操作前读取的上下文信息大幅减少,出错率显著上升,且频繁需要用户人工干预。更令人不安的是,模型还出现了提前终止任务、推卸责任、无意义征求用户许可等异常行为。 劳伦佐在报告中直言不讳:"Claude Code在2月份更新后,已无法胜任复杂的工程任务。" 这一结论在开发者社区引发强烈共鸣。多位开发者在GitHub和Reddit上纷纷留言,表示遭遇了相同的问题。微软首席研究经理季米特里斯·帕帕伊洛普洛斯也在X平台发文称: "过去两周,Claude Code的使用体验令人极其沮丧。即便我已经将推理努力度调至最高,它仍极其粗心,忽略指令,反复出错。" 网红开发者Om Patel甚至指出,Claude Opus 4.6的"思考量比以前少了三分之二"。更有多位开发者直言:"感觉像在用一年前的Claude。" 面对铺天盖地的投诉,Claude Code产品负责人终于在GitHub和论坛上做出公开回应。他承认,Anthropic确实于3月3日将Claude默认的"推理努力程度"从高等级下调至"中等"(强度值85),目的是"减少每次请求消耗的Token数量,从而优化整体推理成本"。 简单来说,Token消耗与算力成本直接挂钩。单次任务处理的Token量越大,消耗的算力就越高。Anthropic此举的本质,是在用户不知情的情况下,通过削减模型的思考深度来降低运营成本。 产品负责人辩称这一调整"基于用户反馈"——此前有部分用户认为Claude消耗Token过多——并声称已通过Claude Code界面内的弹窗提示了用户。然而,大量用户反驳称,该公司进行如此重大的机制调整时并未做出充分、明确的披露。 对于一直以"更透明、更符合用户利益"作为品牌形象的Anthropic而言,此次被指"暗箱操作"无疑是致命打击。 业界普遍猜测,Anthropic正面临严重的算力瓶颈。尽管过去几个月其产品需求呈爆发式增长——日活用户从400万涨至1100万,年化经常性收入已达300亿美元——但该公司官宣的数十亿美元级数据中心扩容协议数量,远不及OpenAI等竞争对手。 种种迹象印证了这一猜测:近期Anthropic多次出现服务中断,并在高峰时段实施更严格的使用限制。CNBC曝光的一份OpenAI内部备忘录甚至直言,Anthropic未能获取充足的算力资源是一项"战略失误"。 与此同时,Anthropic上周宣布已训练出名为Mythos的新模型,性能远超旗舰Opus系列。但公司以"安全考量"为由暂不发布,且该模型运行成本和算力消耗更高,进一步加剧了外界对其算力资源短缺的质疑。 业内研究总监表示:"这本质上是算力和成本问题。复杂的工程任务需要消耗大量计算资源,随着使用量的攀升,系统已无法为每一个请求维持如此高强度的算力投入。" 事实上,随着"代理式"人工智能系统的市场需求增速远超基础设施的扩容速度,整个AI行业都面临着GPU成本高企和数据中心扩展受限的困境。AI企业不得不在产品优先级上做出艰难取舍——是保证少数重度用户的极致体验,还是让更多用户获得"够用"的服务? 行业分析师指出:"发生变化的不仅是输出质量,还有系统在生成输出过程中的行为方式。从审慎的逐步推理到更快速、更被动的执行——这种漂移清晰可见。工程师不得不更频繁地介入,最终亲自承担本应由系统处理的思考工作。" 产品负责人表示,作为补救措施,公司计划测试为团队版和企业版用户默认提供更高推理强度设置,以便用户获得更深入的推理结果,即便这会消耗更多Token并产生响应延迟。同时,旗舰模型Claude Opus 4.6已引入"自适应推理"功能,允许模型根据任务复杂度自主决定推理力度。 对于正在筹备IPO的Anthropic来说,这场风波来得实在不是时候。过去几年间,Anthropic凭借技术实力和安全理念,在开发者和企业用户中积累了良好的口碑,甚至在与美国国防部的争端中赢得大量消费者支持。 然而,用户信任一旦受损,修复起来远比失去时困难得多。如果性能问题持续发酵,加之透明度不足的质疑不断升级,不仅有损其辛苦建立的品牌口碑,更可能在IPO的关键窗口期让投资者望而却步。 正如劳伦佐在GitHub分析中所言,她已暂时放弃Claude Code,转而使用竞品。虽然她对Anthropic自我纠偏仍持乐观态度,但也建议公司推出高级付费层级,让有需求的用户为更强的推理算力买单。 这场"降配"风波给所有AI企业敲响的警钟是:在追求商业增长的道路上,技术透明和用户信任永远是不可逾越的底线。当企业选择在暗处动刀子时,用户的脚投票终将不会缺席。
上一篇【参考模板】在工作大会上的讲话
下一篇Animate2024 安装教程
基本
文件
流程
错误
SQL
调试
请求信息 : 2026-04-20 04:52:15 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/547535.html 运行时间 : 0.101247s [ 吞吐率:9.88req/s ] 内存消耗:4,795.75kb 文件加载:145 缓存信息 : 0 reads,0 writes 会话信息 : SESSION_ID=75c9e6cf39a04203ff1de0e8dba6fd8a
CONNECT:[ UseTime:0.000487s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4 SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000730s ] SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000296s ] SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000287s ] SHOW FULL COLUMNS FROM `set` [ RunTime:0.000470s ] SELECT * FROM `set` [ RunTime:0.000195s ] SHOW FULL COLUMNS FROM `article` [ RunTime:0.000555s ] SELECT * FROM `article` WHERE `id` = 547535 LIMIT 1 [ RunTime:0.000651s ] UPDATE `article` SET `lasttime` = 1776631936 WHERE `id` = 547535 [ RunTime:0.008775s ] SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000363s ] SELECT * FROM `article` WHERE `id` < 547535 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000590s ] SELECT * FROM `article` WHERE `id` > 547535 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.000508s ] SELECT * FROM `article` WHERE `id` < 547535 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.003793s ] SELECT * FROM `article` WHERE `id` < 547535 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.000859s ] SELECT * FROM `article` WHERE `id` < 547535 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.002592s ]
0.102971s