当微软说AI比人贵,黄仁勋说要花4万亿微软发了一份报告,说在特定工作场景里,部署AI的成本已经 高于支付人工工资。报告分析了基于token和agent的使用模式,结论是:综合开销超过了雇佣人类员工完成同类任务的费用。这个结论挺有意思的,一个最激进的AI平台厂商,自己站出来说用AI比雇人还贵。 然后黄仁勋就出来啪啪打脸了。英伟达2027财年Q1财报,营收816亿美元,同比增长85%,净利润583亿美元,翻了两倍多。市值5.7万亿美元,已经超过德国2026年的GDP预测。黄仁勋预测,超大规模云厂商的AI基建年度开支要从当前的1万亿美元,增长到3到4万亿美元,远超华尔街预期。 一边说成本太高不划算,一边说还要再砸三倍的钱进去。这两个观点放在一起看,其实不矛盾。微软说的是「当前特定场景下用大模型token换人工」不划算,黄仁勋看的是「整个基础设施的长期投入」。一个在算眼前账,一个在算未来账。但普通创业者看到这两条新闻,真的会陷入自我怀疑:我到底该不该上AI? 我自己也在想这个问题。坦率的讲,现在AI的落地成本确实处在一个尴尬期——模型调用费在降,但agent的token消耗在猛涨。SemiAnalysis从43.2万个真实编码agent请求里拉了个数据,中位数输入token是9.6万。什么概念?在你问问题之前,模型已经处理了超过一整本《了不起的盖茨比》的文本长度。所以微软那个报告,它反映的是当下真实的落地困境,不是唱反调。 Anthropic的Project Glasswing:10,000个漏洞的警示,也是AI安全能力的证明 另一个让我觉得必须单独拿出来聊的事,是Anthropic的Project Glasswing。上个月启动的项目,用Claude Mythos Preview模型来保障关键软件安全。初步更新的数据出来了:通过约50家合作伙伴,已经在全球关键系统中发现了超过10,000个高危或严重漏洞。 几个数字值得细看。Cloudflare在他们的关键路径系统里发现了2,000个漏洞。Mozilla在Firefox 150中发现了271个漏洞并全部修复,数量远超前代模型。多家合作伙伴报告漏洞发现效率提升了超过十倍。 这个数据让我挺震撼的。不是因为10,000这个数字本身,而是因为它证明了一件事:AI在安全领域的能力已经从「辅助工具」进化到了「主力发现者」。以前安全审计靠人工,一个资深安全工程师一天能审的代码量是有限的,而且会累、会漏。AI不会累,不会漏,它会一行一行地扫过去。你给它一个Firefox的代码库,它给你找出271个漏洞——这在两年前是不可想象的。
但反过来想,这也意味着一个可怕的事实:我们过去两年在网上运行的软件里,可能藏着几百上千个没人发现的漏洞。只是AI之前没那么强,没人去扫而已。
Karpathy的65行规则:慢下来,准确率从65%到94% Karpathy又炸了一次GitHub。这次不是什么新框架新模型,就是一个65行的CLAUDE.md文件,4条核心规则,22万星标,登顶GitHub趋势榜。效果有多夸张?AI编程的准确率从65%拉到了94%。可以说是用最少的代码,实现了最大的影响力。
四条规则的核心就一个词:慢下来。强制开发者把深度思考、追求简洁、精准修改和目标驱动变成硬性编码准则。这背后其实是一个很微妙的洞察——大多数AI编程出问题,不是因为模型不够聪明,而是开发者给了模型太模糊的指令,然后习惯性地说「先写再说」。 我试了一下,把我的项目CLAUDE.md加了几条类似的规则,虽然没到94%那么夸张,但确实明显感觉到模型的输出质量上去了。最明显的变化是它会先列计划再写代码,而不是直接开干然后写到一半发现方向错了。 Google I/O的Agent化宣言:从对话助手到自主代理 Google I/O 2026的对话环节落幕,但真正值得关注的是Google在Agent方向的系统性布局。这次不是发一个新品,而是发了一整套工具链。 几个关键更新:独立桌面应用Antigravity 2.0和命令行工具发布了;Google AI Studio新增Kotlin支持,可以一键开发安卓应用并发布;Gemini API推出托管代理服务,实现一键部署;最让我注意的是WebMCP——一个在Chrome 149中推出的开放标准,允许网页向Agent暴露能力接口。 WebMCP这个事挺有意思的。MCP(Model Context Protocol)之前是Anthropic在推,Google这次搞了个WebMCP,直接在浏览器层面让Agent能和网页交互。这相当于在底层架构上给Agent「开了个后门」。以后Agent可能不需要通过API,直接通过浏览器就能操作各种网页服务。这对整个Web生态的影响,可能比我们想象的要大得多。 华为昇腾910B上的1.58比特模型:中国AI基础设施的一个信号 ModelBest、清华大学和OpenBMB社区联合发布了BitCPM-CANN,是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。 这个标题里信息量很大。1.58比特什么意思?只有三种权重状态,内存占用比BF16降低了约6倍。这意味着什么?可以高效部署在手机、电脑、车载设备这些边缘端。更关键的是,整个训练全栈——从量化算子到框架——都在昇腾上原生构建和验证,不是简单从CUDA移植过来的。 我一直觉得,中国AI的自主可控不能只靠「我们也有一个差不多的模型」,而是要在芯片、框架、生态层面形成闭环。BitCPM-CANN这个项目,虽然模型规模不大(0.5B起步),但它的意义在于证明了昇腾这条路线是走得通的。从硬件到算子到框架到模型,全部跑通,不是PPT。 DeepSeek那边也有动作,V4-Pro宣布永久降价。之前是优惠价,现在直接永久化。模型能力越来越强、价格越来越低,这是好事,但也意味着纯靠API调用的商业模式会越来越难做。 创意内容:Suno的夏日神曲和Kling的戛纳登场 Suno用AI做了今年夏天的爆款歌曲《波多黎各》,上了GMA,在X上被疯狂转发。AI音乐从「能听」到「能爆」,这个节点可能比我们预期的来得快。 Kling AI在戛纳电影节举办了官方会议,这是中国AI视频生成公司第一次登上世界顶级电影舞台。Kling展示的能力已经覆盖了动画长片、好莱坞剧集、实验短片和影院电影。说实话,一年前我还在怀疑AI视频的实用性,但现在看,至少在动画和短片领域,AI已经是一个可以用的生产力工具了。 AI帮你填表单:ChatGPT语音模式的一个实用场景 ChatGPT发了一个看起来不起眼但实际挺有用的功能更新——语音模式可以帮你填表单了。你上传一个表单图片,用嘴说内容,ChatGPT就给你填好返回。这个场景其实很戳痛点,谁没因为填表抓狂过?各种政务表单、税务表单、医疗表单,格式复杂、填空繁琐。能用语音搞定,体验好太多了。 Cursor和GitHub:AI编码代理的Gartner双雄 Gartner发布了2026年企业级AI编码代理魔力象限,GitHub和Cursor双双被评为领导者。GitHub连续第三年入选,Cursor则是第一次且同时在愿景完整性上领先。超过70%的财富500强企业用Cursor部署和管理编码代理。 这个象限的意义不在于谁排前面,而在于证明了AI编码代理已经从「尝鲜工具」变成了「企业标配」。两年前还在讨论AI会不会写代码,现在70%的财富500强已经在用代理管理代码了。 一条隐线:AI的成本焦虑正在成为行业共识 梳理完今天的主要新闻,我发现有一条隐线贯穿其中。微软的报告说AI比人贵,SemiAnalysis的数据说agent token消耗在暴涨,Perplexity开源了供应链安全扫描工具Bumblebee来补agent化带来的安全隐患。 大家都在焦虑。成本焦虑、安全焦虑、人才焦虑。奥纬咨询的报告说74%的CEO已经冻结或缩减招聘,计划削减初级岗位的比例从17%跃升到43%。AI替代的不只是工作,更是年轻人的入行通道。 但这个焦虑本身是有意义的。说明行业在从「什么都试一下」进入「精打细算地落地」阶段。泡沫在退,真问题在水面下浮现。真正能解决问题的公司和产品,会在这一轮拷问中跑出来。 以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧~