当微软说AI比人贵,黄仁勋说要花4万亿

同一天，两条完全相反的信息出现在AI行业。

微软发了一份报告，说在特定工作场景里，部署AI的成本已经

高于支付人工工资。报告分析了基于token和agent的使用模式，结论是：综合开销超过了雇佣人类员工完成同类任务的费用。这个结论挺有意思的，一个最激进的AI平台厂商，自己站出来说用AI比雇人还贵。

然后黄仁勋就出来啪啪打脸了。英伟达2027财年Q1财报，营收816亿美元，同比增长85%，净利润583亿美元，翻了两倍多。市值5.7万亿美元，已经超过德国2026年的GDP预测。黄仁勋预测，超大规模云厂商的AI基建年度开支要从当前的1万亿美元，增长到3到4万亿美元，远超华尔街预期。

一边说成本太高不划算，一边说还要再砸三倍的钱进去。这两个观点放在一起看，其实不矛盾。微软说的是「当前特定场景下用大模型token换人工」不划算，黄仁勋看的是「整个基础设施的长期投入」。一个在算眼前账，一个在算未来账。但普通创业者看到这两条新闻，真的会陷入自我怀疑：我到底该不该上AI？

我自己也在想这个问题。坦率的讲，现在AI的落地成本确实处在一个尴尬期——模型调用费在降，但agent的token消耗在猛涨。SemiAnalysis从43.2万个真实编码agent请求里拉了个数据，中位数输入token是9.6万。什么概念？在你问问题之前，模型已经处理了超过一整本《了不起的盖茨比》的文本长度。所以微软那个报告，它反映的是当下真实的落地困境，不是唱反调。

Anthropic的Project Glasswing：10,000个漏洞的警示，也是AI安全能力的证明

另一个让我觉得必须单独拿出来聊的事，是Anthropic的Project Glasswing。上个月启动的项目，用Claude Mythos Preview模型来保障关键软件安全。初步更新的数据出来了：通过约50家合作伙伴，已经在全球关键系统中发现了超过10,000个高危或严重漏洞。

几个数字值得细看。Cloudflare在他们的关键路径系统里发现了2,000个漏洞。Mozilla在Firefox 150中发现了271个漏洞并全部修复，数量远超前代模型。多家合作伙伴报告漏洞发现效率提升了超过十倍。

这个数据让我挺震撼的。不是因为10,000这个数字本身，而是因为它证明了一件事：AI在安全领域的能力已经从「辅助工具」进化到了「主力发现者」。以前安全审计靠人工，一个资深安全工程师一天能审的代码量是有限的，而且会累、会漏。AI不会累，不会漏，它会一行一行地扫过去。你给它一个Firefox的代码库，它给你找出271个漏洞——这在两年前是不可想象的。

但反过来想，这也意味着一个可怕的事实：我们过去两年在网上运行的软件里，可能藏着几百上千个没人发现的漏洞。只是AI之前没那么强，没人去扫而已。

Karpathy的65行规则：慢下来，准确率从65%到94%

Karpathy又炸了一次GitHub。这次不是什么新框架新模型，就是一个65行的CLAUDE.md文件，4条核心规则，22万星标，登顶GitHub趋势榜。效果有多夸张？AI编程的准确率从65%拉到了94%。可以说是用最少的代码，实现了最大的影响力。

四条规则的核心就一个词：慢下来。强制开发者把深度思考、追求简洁、精准修改和目标驱动变成硬性编码准则。这背后其实是一个很微妙的洞察——大多数AI编程出问题，不是因为模型不够聪明，而是开发者给了模型太模糊的指令，然后习惯性地说「先写再说」。

我试了一下，把我的项目CLAUDE.md加了几条类似的规则，虽然没到94%那么夸张，但确实明显感觉到模型的输出质量上去了。最明显的变化是它会先列计划再写代码，而不是直接开干然后写到一半发现方向错了。

Google I/O的Agent化宣言：从对话助手到自主代理

Google I/O 2026的对话环节落幕，但真正值得关注的是Google在Agent方向的系统性布局。这次不是发一个新品，而是发了一整套工具链。

几个关键更新：独立桌面应用Antigravity 2.0和命令行工具发布了；Google AI Studio新增Kotlin支持，可以一键开发安卓应用并发布；Gemini API推出托管代理服务，实现一键部署；最让我注意的是WebMCP——一个在Chrome 149中推出的开放标准，允许网页向Agent暴露能力接口。

WebMCP这个事挺有意思的。MCP（Model Context Protocol）之前是Anthropic在推，Google这次搞了个WebMCP，直接在浏览器层面让Agent能和网页交互。这相当于在底层架构上给Agent「开了个后门」。以后Agent可能不需要通过API，直接通过浏览器就能操作各种网页服务。这对整个Web生态的影响，可能比我们想象的要大得多。

华为昇腾910B上的1.58比特模型：中国AI基础设施的一个信号

ModelBest、清华大学和OpenBMB社区联合发布了BitCPM-CANN，是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。

这个标题里信息量很大。1.58比特什么意思？只有三种权重状态，内存占用比BF16降低了约6倍。这意味着什么？可以高效部署在手机、电脑、车载设备这些边缘端。更关键的是，整个训练全栈——从量化算子到框架——都在昇腾上原生构建和验证，不是简单从CUDA移植过来的。

我一直觉得，中国AI的自主可控不能只靠「我们也有一个差不多的模型」，而是要在芯片、框架、生态层面形成闭环。BitCPM-CANN这个项目，虽然模型规模不大（0.5B起步），但它的意义在于证明了昇腾这条路线是走得通的。从硬件到算子到框架到模型，全部跑通，不是PPT。

DeepSeek那边也有动作，V4-Pro宣布永久降价。之前是优惠价，现在直接永久化。模型能力越来越强、价格越来越低，这是好事，但也意味着纯靠API调用的商业模式会越来越难做。

创意内容：Suno的夏日神曲和Kling的戛纳登场

Suno用AI做了今年夏天的爆款歌曲《波多黎各》，上了GMA，在X上被疯狂转发。AI音乐从「能听」到「能爆」，这个节点可能比我们预期的来得快。

Kling AI在戛纳电影节举办了官方会议，这是中国AI视频生成公司第一次登上世界顶级电影舞台。Kling展示的能力已经覆盖了动画长片、好莱坞剧集、实验短片和影院电影。说实话，一年前我还在怀疑AI视频的实用性，但现在看，至少在动画和短片领域，AI已经是一个可以用的生产力工具了。

AI帮你填表单：ChatGPT语音模式的一个实用场景

ChatGPT发了一个看起来不起眼但实际挺有用的功能更新——语音模式可以帮你填表单了。你上传一个表单图片，用嘴说内容，ChatGPT就给你填好返回。这个场景其实很戳痛点，谁没因为填表抓狂过？各种政务表单、税务表单、医疗表单，格式复杂、填空繁琐。能用语音搞定，体验好太多了。

Cursor和GitHub：AI编码代理的Gartner双雄

Gartner发布了2026年企业级AI编码代理魔力象限，GitHub和Cursor双双被评为领导者。GitHub连续第三年入选，Cursor则是第一次且同时在愿景完整性上领先。超过70%的财富500强企业用Cursor部署和管理编码代理。

这个象限的意义不在于谁排前面，而在于证明了AI编码代理已经从「尝鲜工具」变成了「企业标配」。两年前还在讨论AI会不会写代码，现在70%的财富500强已经在用代理管理代码了。

一条隐线：AI的成本焦虑正在成为行业共识

梳理完今天的主要新闻，我发现有一条隐线贯穿其中。微软的报告说AI比人贵，SemiAnalysis的数据说agent token消耗在暴涨，Perplexity开源了供应链安全扫描工具Bumblebee来补agent化带来的安全隐患。

大家都在焦虑。成本焦虑、安全焦虑、人才焦虑。奥纬咨询的报告说74%的CEO已经冻结或缩减招聘，计划削减初级岗位的比例从17%跃升到43%。AI替代的不只是工作，更是年轻人的入行通道。

但这个焦虑本身是有意义的。说明行业在从「什么都试一下」进入「精打细算地落地」阶段。泡沫在退，真问题在水面下浮现。真正能解决问题的公司和产品，会在这一轮拷问中跑出来。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧～

谢谢你看我的文章，我们，下次再见。