
一、到底升级了啥?
SWE-bench Pro编程测试:64.3%,比上一代高了近11个点 工具调用评测:77.3%,领先GPT-5.4和Gemini 3.1 Pro 错误自我修复率:80%(写错了能自己改回来)

二、我实测了三个场景,结果差别挺大
三、Claude Code的渗透速度比我想的快
/ultrareview命令:专门做代码审查,逐行查语法、可维护性、安全性、性能 Auto模式扩展到Max用户:减少人工确认中断,长任务跑得更顺 任务预算功能公测:开发者可以限定“最多消耗多少token”,成本终于可控了
四、普通人最该关注哪个能力?
AI编程:适合所有人,能接外包、做小工具、做网站,难度两颗星 AI视觉分析:适合数据或设计从业者,间接提高效率,难度三颗星 AI创作:适合自媒体/运营,但需要大量人工润色,难度一颗星

五、给普通人的三条实在建议
写个自动整理Excel的小工具 写个批量重命名文件的脚本 写个简单的个人网页

六、泼点冷水吧
别拿它做专业领域的绝对判断——医疗、法律、财务等建议,仅供参考,不能替代真人专家。 别指望一次性出完美作品——无论代码还是文章,AI的第一版都不完美,但它给了你一个“能跑”的起点。 注意token消耗——官方说分词器更新后,token消耗是之前的1.0到1.35倍。长任务要盯着点用量。
夜雨聆风