乐于分享
好东西不私藏

当AI编程工具不再完美:Claude Code问题观察

当AI编程工具不再完美:Claude Code问题观察

从2025年到2026年,Anthropic两次公开承认Claude Code存在性能问题。全球开发者社区围绕使用体验的讨论也在持续。

2026年4月23日,Anthropic发布了一份事后复盘报告,承认Claude Code在过去一个月中出现了质量下降。这是Anthropic继2025年9月之后,第二次就模型性能问题公开发布说明。

与此同时,Claude Code的使用限额政策不断调整,2026年4月还出现了Pro方案中Claude Code权限短暂消失的事件。技术社区(V2EX、知乎、InfoQ、CSDN等)对相关问题的讨论热度也在上升。

本文梳理近期Claude Code暴露的主要问题,信息来源于公开报道和开发者社区讨论。

一、2026年”降智”:官方复盘确认三个问题

据腾讯新闻、InfoQ等媒体报道,2026年3月起,陆续有用户在Hacker News、Reddit等社区反馈Claude Code变慢、变笨。4月23日,Anthropic发布复盘报告,确认了三个问题的叠加影响:

1. 推理强度默认值调整

3月4日,Anthropic将Claude Code的默认推理强度从”high”调整为”medium”,目的是减少部分用户遇到的超长延迟。4月7日,在用户反馈后撤回了该改动。但此次调整影响了Sonnet 4.6和Opus 4.6。

2. 缓存清理Bug

3月26日上线的会话清理逻辑出现Bug:对超过一小时未使用的会话,清理操作在后续每一轮对话中持续触发(而非只执行一次),导致模型”持续失忆、健忘且重复”。4月10日修复。

3. 系统提示词变更

4月16日,系统提示词中加入”降低冗长度”指令(工具调用间文本不超过25词)。叠加其他改动后,损害了代码任务的表现。4月20日撤回,但同样影响了Sonnet 4.6、Opus 4.6和Opus 4.7。

Anthropic表示,这些改动在不同时间作用于不同流量切片,叠加效果表现为”广泛且不一致”的性能下降。作为补偿,重置了所有订阅用户的使用限额。

– [Anthropic官方复盘](https://www.anthropic.com/engineering/april-23-postmortem)

二、2025年的前车之鉴:基础设施Bug导致的质量下降

实际上,这并非Anthropic第一次面对”降智”质疑。据机器之心(腾讯新闻转载)报道,2025年8月至9月初,Claude也曾出现过一轮性能下降。

当时Anthropic确认了三项基础设施Bug:

上下文窗口路由错误:部分Sonnet 4请求被错误路由至为1M token上下文窗口配置的服务器,到8月31日影响最严重时,Sonnet 4全部请求中约16%受到影响。

输出异常:TPU服务器上的错误配置导致token生成过程出错,偶发在英语回答中生成泰语或中文字符。

XLA:TPU编译器Bug:近似top-k算法在某些批次大小下返回错误结果,影响token选择精度。

机器之心在报道中指出,尽管Anthropic声称问题已修复,但直到9月1日,用户负反馈不减反增。有用户表示”Opus变得很’懒'”,”凌晨两点用起来顺畅,白天高峰期被限流后非常糟糕”。

三、社区反馈:思考深度下降与代码质量波动

思考深度变化

据与非网报道,社区有开发者对Claude Code的thinking深度进行了分析,发现从2026年2月底开始,模型平均思考内容长度出现明显下降。有分析称降幅约67%(从约2200字符降至约720字符),但该数据为社区自行分析结果,非官方确认。

在非官方测试中,有开发者反映Claude Opus 4.6在BridgeBench幻觉基准测试中的排名出现波动,从第2名跌至第10名。该数据来自V2EX用户分享,仅供参考。

 代码质量问题

知乎上有开发者提问:”用Claude Code写代码,总是改出新Bug、测试也出问题,怎么办?” 多位开发者分享了类似体验:

“AI写代码速度是快,但质量不稳定,经常要花更多时间收拾烂摊子。”

掘金上有开发者总结了使用Claude Code三个月踩过的坑,包括循环修改同一处代码、忽略关键依赖、生成覆盖错误场景的测试用例等。

四、配额限流:付费用户的实际体验

双层限额机制

Claude Code采用”5小时滚动窗口 + 7天周上限”的双层限流机制。据国内媒体报道,各订阅方案的大致配额:

订阅方案

月费 

大致体验

Pro

$20/月 
轻量使用,高频开发易触达限制

Max 5x

$100/月

中度使用,仍有限制

Max 20x

$200/月

重度使用,配额显著增加但仍非无限

Token消耗偏快

据博客园和腾讯云开发者社区报道,有开发者发现Claude Code在Extra Usage模式下存在缓存时长被静默降级的问题(从1小时降至5分钟),可能导致token消耗增加。该问题在CLI原生安装包用户中影响较大,建议升级至v2.1.91+版本。

另有开发者反映,Claude网页聊天与Claude Code共用配额,轻度聊天也会占用开发额度。

五、Pro方案风波:Claude Code权限短暂消失

2026年4月21日前后,有用户发现Anthropic定价页面上,Pro方案($20/月)已不再将Claude Code列为包含功能。据UNWIRE和搜狐报道,这一变化可能是Anthropic的A/B测试。到4月26日,Claude Code重新出现在Pro方案权益中。

更早前的4月4日,Anthropic封锁了所有第三方agentic框架对Pro/Max订阅额度的使用,相关用户被迫改用API方案,费率最高相差约50倍。该事件被36氪等国内媒体报道。

六、国内用户的额外考量

地区访问限制

2025年9月,Anthropic更新了服务条款,明确限制来自中国等地区的直接访问。11月起,部分中国开发者的账号被封禁。触发原因包括使用VPN访问、IP地址频繁变动等。

安全漏洞

Veracode 2025年生成式AI代码安全报告指出,45%的AI生成代码样本未通过安全测试,引入了OWASP前10名漏洞。Claude Code自身也发现了三个关键漏洞(CVE-2025-54794/54795/52882),涉及路径限制绕过、命令注入和WebSocket认证绕过。

七、我们该怎么看?

综合国内媒体和社区讨论,Claude Code近期暴露的问题可以归纳为三个方面:

1. 质量稳定性。 Anthropic两次公开承认性能问题(2025年8-9月、2026年3-4月),原因均为基础设施变更引入的Bug,而非有意”降智”。但频繁的变更和修复,客观上影响了用户体验和信任。

2. 配额与成本的平衡。双层限额机制下,重度用户(尤其是Pro和Max 5x)仍可能触达限制。Token消耗偏快、缓存机制Bug等问题进一步放大了用户的”不够用”感受。Anthropic需要在商业可持续性和用户体验之间找到更好的平衡点。

3. AI编程工具的共性挑战。代码质量不稳定、安全漏洞、”改一个Bug出三个新问题”——这些问题并非Claude Code独有,而是当前AI编程工具的共性。Veracode报告显示45%的AI生成代码存在安全漏洞,值得所有使用者警醒。

写在最后

AI编程工具仍在快速迭代中。Claude Code的代理式编程能力确实为开发者提供了新的工作方式,但质量稳定性、配额限制和代码安全等问题也不容忽视。对于开发者而言,保持理性认知、多工具并行、人工审查关键代码,或许是最务实的使用策略。