Noah的AI观察
AI深度实践 · 一线实战派
能力在收敛,控制在集中
每日AI资讯简报· 04.15
Claude缓存翻车 / Opus 4.7曝光 / Cursor套壳实锤 / 斯坦福中美差2.7% / Mythos攻破企业网络
01
今日速览
HIGHLIGHTS
02
深度聚焦
DEEP DIVE
///
今日感悟
INSIGHT
有人分析了119,866次API调用,发现3月3日之后缓存TTL悄悄从1小时缩到5分钟。直接后果:同样的工作,2月花$345,3月要$42,121。Pro用户5小时预算1.5小时见底,$200/月Max计划2小时花完。Anthropic回应是"架构耦合问题",但数据解释不了缓存废弃率为什么跳了24倍。
Claude Code完成重构,新功能Routines支持定时触发、API端点、GitHub webhook三种方式——让Claude在你不在线时自主跑任务。配额:Pro每天5次,Max15次,Team/Enterprise25次。一个PR从提交到审核到合并,全程Claude盯着。Opus 4.7本周发布,还有新设计工具要挑战Adobe和Figma。
UI层50+个服务,Composer层40+个服务,全是包装;核心逻辑调的是Anthropic的API。代码里明确把"Claude"替换成"Cursor",过滤掉Anthropic计费头部,还屏蔽了GitHub Copilot。500亿美元估值,靠的是Ctrl+H?
2023年差距超300分Elo,今年只剩2.7%(美国1503 vs 中国1464)。企业AI采用3年内覆盖53%,速度超PC和互联网。坏消息:22-25岁程序员岗位同比下降20%,入职门槛正被AI抹平。基础模型透明度指数从58分跌到40分,安全事故上升56%。
红队测试中,Mythos完成32步企业网络攻击链——人类专家需要20小时,Mythos几秒钟。CTF专家级任务成功率73%(上一代最多完成16步)。三大突破:无指令自主运行、检测零日漏洞、算力预算越多性能越强。高盛已紧急升级内网安全。
今天关于Anthropic的新闻,有种奇怪的撕裂感。
左手:Claude缓存翻车,用户费用暴涨100倍,集体声讨。AMD的AI负责人分析了6852次Claude Code会话,读写比从6.6降到2.0,推理深度下降67%;用户情感分析里"懒惰"词频涨了93%,"糟糕"涨了140%。
右手:Claude Code一夜重构,Routines上线,Opus 4.7本周发布,还有设计工具要挑战Adobe和Figma。
两件事同时发生,说明什么?说明Anthropic处于一个微妙的节点——在"把现有用户伺候好"和"用资源赌下一个大功能"之间不断腾挪。缓存缩短省下来的算力,可能就砸进了Routines和Opus 4.7的研发。
Cursor的事更有意思。逆向代码证实了很多人早就怀疑的事:Agent mode就是Claude Code SDK,套了层壳,改了个名字。这件事重新提出一个问题:应用层公司的价值在哪里?当底层模型变成水电一样的基础设施,真实的护城河只剩三个——用户数据、工作流集成、品牌信任。Cursor靠100次对话建立的用户画像注入每个session,这个是真的;但把"Cursor智能"等同于"Cursor自研",走得有点险。
斯坦福AI报告今年423页,每年都厚一点,结论却越来越难讲清楚。
说能力:中美差距从300分Elo缩到2.7%。坏消息是这意味着"谁家模型更聪明"这个问题,很快就会变成没有意义的问题。基准测试已经在失灵——GSM8K里有42%的题本来就是错的,模型背住了答案,不代表真的会推理。
说就业:AI最先打掉的不是所有工人,是22-25岁程序员,入职岗位同比下降20%,而经验丰富的程序员还在增长。AI没有消灭程序员,但它正在关掉那扇让新人入行的门。
说透明度:模型透明度指数从58分跌到40分,95家知名模型里80家不公开训练代码,AI安全事故上升56%。我们正在用超过理解速度的节奏部署AI。
OpenAI的备忘录炮轰Anthropic虚报营收80亿,同时展示了算力账本:OpenAI 2025年目标1.9GW,2030年30GW;Anthropic 2027年预计7-8GW。这场对话的重点不是谁赢了,而是算力已经成为主战场——当模型能力越来越接近,谁掌握更多电力和GPU,谁就赢。
但今天还有一条容易被忽略的新闻:全球AI芯片有一个单点故障,不在台积电,不在英伟达,而在日本一家叫Ajinomoto(味之素)的公司——就是做味精的那家。
这家公司控制着全球95%+的ABF(味之素堆积膜)市场。这种绝缘薄膜是AI加速芯片封装的核心材料,用量是传统PC芯片的10-18倍。他们的2030年扩产计划只能让产能提升50%,而AI需求增速是两位数。英伟达在排队,云厂商在预付定金。
▸OpenAI活成了自己最看不上的样子:1220亿融资要求1.2万亿IPO估值;Sora被搁置,ChatGPT被降优先级,资源全压Codex替代软件开发者。从"AGI造福人类"变成"用AI替换你的程序员"
▸Vidu Q3双榜登顶全球第一:AA和SuperClue基准同时超越Grok Imagine、Gen-4.5、Veo 3.1。6大特效+5类沉浸音效,角色一致性锁定,定价是竞品三分之一
▸华为重夺中国手机市场第一:Q1出货1390万台(20%份额),苹果1310万(19%)。内存成本上涨时竞品涨价,华为没动,这就是全部原因
▸约束先行:比所有Prompt技巧都重要的四个字:数字生命卡兹克分享了几个月高强度用Agent后的心得——全局CLAUDE.md是城市主干道,项目CLAUDE.md是片区支路,路网没规划好后面再优化也没用
▸NTU发布Hand2World:第一人称视角手势驱动世界模型,FVD提升76%,从"能看能动"到"能碰能改"的闭环交互
▸斯坦福报告:Foundation Model透明度崩塌:赛博禅心完整解读423页报告,95家模型中80家不公开训练代码,专家与公众对AI就业影响的判断差距高达50个百分点
今天18篇看完,有一个感觉越来越强烈:这个行业正在同时经历两种力量的拉扯。
一边是能力在收敛——中美差距2.7%,基准测试开始失灵,Cursor拆开来看发现里面是Claude Code。那个"谁的模型更聪明"能决定一切的时代,正在悄悄结束。
另一边是控制在集中——算力(OpenAI vs Anthropic的30GW争夺)、材料(Ajinomoto卡住全球95% ABF)、用户数据(Cursor的100次对话画像)、工作流入口(Routines把Claude嵌进你的每一天)。能力趋同之后,护城河就在这些地方。
最讽刺的是:同一周,Anthropic把缓存TTL从1小时缩到5分钟,让用户成本涨了100倍;又发布Routines,让Claude替你7×24不停工作。降低你的旧成本,同时提高你对它的依赖。这不是矛盾,这是商业逻辑。
不是让你觉得它很厉害,
而是让你离不开它。
不管是做AI产品的,还是用AI工具的,这可能是今天最值得想清楚的一件事。
既然看到这里了
如果觉得有用,先点个赞,再顺手点个在看或转发
THANKS FOR READING
夜雨聆风