AI速览:文心5.1发布6%成本登顶国内、字节AI支出2000亿、GPT-5.5 Pro解数学难题(26.5.10)

2026年5月10日

5月10日，国产大模型和全球AI资本同时按下了加速键。百度正式发布文心5.1，以业界同规模模型仅6%的预训练成本，登顶LMArena搜索榜国内第一、全球第四——在算力成本高企的AI竞赛中，用更少的钱做同样的事正在成为一种新的竞争力。字节跳动计划将AI基础设施支出增加25%至2000亿元人民币，英伟达年内股权投资突破400亿美元布局AI生态——资本的流向正在重塑AI的权力版图。学术前沿，菲尔兹奖得主高尔斯详细记述了用ChatGPT 5.5 Pro解决复杂数学问题的经历，称其为"第一个能可靠解决博士级数学问题的LLM"——继昨天的"危机"警告后，今天给出了更具体的技术实证。而一篇新论文揭示了一个令人不安的发现：委托LLM处理文档会导致"语义消融"，就像反复压缩JPEG一样——AI的均值回归本性，正在悄悄侵蚀人类表达中的细微差别。

一、文心5.1正式发布：6%成本的国产效率标杆

百度于5月9日正式发布文心大模型5.1，采用"多维弹性预训练"技术，在充分继承文心5.0知识的基础上，将总参数压缩至约1/3、激活参数压缩至约1/2，仅以业界同规模模型约6%的预训练成本实现基础效果领先。

核心突破是"Once-for-All弹性训练框架"：传统方法需为不同规模模型分别预训练，而文心5.1仅在单次预训练中，通过动态采样机制同时优化大量子模型，在弹性深度、弹性宽度、弹性稀疏度三个维度实现压缩，一次训练，处处部署。性能方面，文心5.1 Agent能力超越DeepSeek-V4-Pro，创意写作接近Gemini 3.1 Pro，AIME26数学竞赛得分99.6，在LMArena搜索榜以1223分位列国内第一、全球第四，是唯一上榜的国产模型。

6%的预训练成本是个值得深思的数字。在全球算力供不应求的背景下，用更少的算力做同样的事可能比堆算力更具战略价值。不过文心5.1作为闭源模型，私有化部署灵活性不如开源方案，弹性压缩在推理端的实际速度优势也仍需更多实战验证。

作者碎碎念： 6%这个数字杀伤力很强，因为它让人忍不住问：那剩下94%的算力都花哪儿去了？当然，这是不同量级的模型横向比较，不能直接换算，但作为slogan，6%比"领先业界"有说服力得多。Once-for-All听起来很霸气，实际上是说：我只炒一锅菜，但能同时端出大中小三种份量。能做到这件事，工程难度不小，节省下来的成本是真实的。唯一的遗憾是闭源，不过闭源在商业上是理性选择，开源在口碑上是慷慨选择，两者不是非此即彼，而是不同的游戏。

来源：百度官方发布 · May 9, 2026

原文链接：https://yiyan.baidu.com/blog/

二、字节跳动AI支出增至2000亿：算力军备竞赛再升级

字节跳动计划今年将AI基础设施支出增加25%，达到2000亿元人民币，部分原因是AI训练和推理所需的内存芯片成本上涨。

2000亿元大约相当于许多中等国家一年的国防预算。字节跳动正在用国家级行政预算的量级投入AI基础设施，这已经不是企业战略，而是算力军备竞赛。HBM等高带宽内存供不应求，价格持续攀升，也推动了预算增加。字节跳动的AI版图正在急速扩张——豆包测试付费订阅、TikTok获批250亿美元泰国数据中心、AI视频生成模型Seedance……每个动作背后都是巨额算力消耗。2000亿传递的判断是：AI的窗口期很短，现在不投，以后连入场的机会都没有。

作者碎碎念： 2000亿人民币，拆开来看是每天约5.5亿的支出，每小时约2300万，每分钟约38万。当你读完这句话，字节大概已经花出去了几百万。这种量级的投入在历史上只有国家盖航母才会出现。不同的是，航母造完了还能开二十年，数据中心里的GPU两年就要更新换代，这笔钱是会持续烧的。字节的逻辑很清晰：赌输了损失的是钱，赌赢了赢下来的是未来。在这个赌局里，不下注本身就是一种输法。

来源：RSS · 36氪 · May 9, 08:18

原文链接：https://36kr.com/newsflashes/3801787739282952?f=rss

三、英伟达400亿美元投资AI生态：从卖铲子到买金矿

英伟达今年股权投资已突破400亿美元，旨在打造从芯片到AI模型的完整生态体系，锁定下游客户并确保硬件供应稳定。

这让英伟达的角色发生了微妙变化：不再只是卖铲子的人，而是开始买金矿的股份。通过投资AI生态的上下游企业，英伟达正在构建以自身芯片为核心的闭环——你用我的芯片训练模型，我投资你的公司锁定需求，你越成功我越赚钱。这种策略的精妙之处在于：即使未来出现竞争芯片，英伟达已通过股权纽带将核心客户绑定在自己的生态中。当英伟达既是你的芯片供应商又是你的股东，切换供应商的成本将远超技术层面。

作者碎碎念： 400亿美元的股权投资，这让英伟达从一家芯片公司悄悄变成了一家AI领域的风险投资基金，只是它的LP是它自己，它的投后管理工具是GPU供货优先权。这套组合拳打下来，客户和英伟达之间的关系已经很难用"甲乙方"来描述，更像是"我们是利益共同体，所以你最好继续买我的卡"。黄仁勋大概是史上第一个把供应链关系做成股权关系的芯片CEO，这需要相当大的格局，也需要相当大的市值作为底气。

来源：RSS · 36氪 · May 10, 01:22

原文链接：https://36kr.com/newsflashes/3802794581991168?f=rss

四、数学家详测ChatGPT 5.5 Pro：第一个能可靠解博士级数学的LLM

数学家Timothy Gowers发表详细使用记述，报告称ChatGPT 5.5 Pro是第一个能够可靠解决复杂数学问题的LLM，包括适合博士新生的问题。Gowers指出，虽然它仍会犯错并需要严格指导，但能追踪自身推理并比之前模型更好地自我纠正，代价是消耗大量token，成本高昂。

关键字是"可靠"。此前LLM在数学上最大的问题不是不会做，而是不可靠，经常产生看似正确实则错误的推理。ChatGPT 5.5 Pro的突破在于：在严格指导下，它可以被引导到正确答案，并能追踪和纠正自身推理错误。然而高昂的token成本意味着目前只有少数顶级研究者能负担这种AI数学助手，可能加剧而非缩小学术资源的不平等。当菲尔兹奖得主用AI加速研究，而普通博士生连token都买不起时，数学界的"危机"比高尔斯预想的更复杂。

作者碎碎念： 能可靠解博士新生级别的数学题，这句话需要想一想它的射程。博士新生的数学题，是人类经过二十年密集教育才能接触的内容。AI做到这件事用了多少年？从GPT-2到现在，大约六年。人类二十年，AI六年，而且AI还在加速。Gowers说需要"严格指导"，这个细节很重要——它还不能自己跑，需要一个懂数学的人在旁边导航。问题是：当AI能解博士级的题，你还需要博士级的人来给它导航。那个导航员，是越来越贵，还是越来越便宜？这个问题的答案，将决定未来二十年数学博士的市场价值。

来源：Hacker News · alternator · May 9, 02:41

原文链接：https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

五、LLM处理文档导致"语义消融"：AI的JPEG压缩效应

一篇新研究论文表明，将文档处理委托给LLM会导致累积性退化，类似于重复JPEG压缩，并引入了"语义消融"这一概念来描述细微差别和精确性的逐渐丧失。研究还发现，工具使用无法防止这种损坏。

很多组织正在将文档编辑、摘要和改写大量委托给LLM，但每次处理都可能引入细微变化——一个词的替换、一个修饰语的省略、一个逻辑关系的弱化——单次几乎不可察觉，多次迭代后会累积成显著的语义偏移。即使AI能"看到"原文档，它仍然会在重写中丢失信息。社区将LLM称为"均值回归机器"——每次处理都让文本向平均值靠近，独特的声音在反复压缩中逐渐消失。实用建议是：最小化LLM的往返次数，仅将其用作薄薄的翻译层，而非反复重写的编辑器。

作者碎碎念： JPEG压缩类比非常准确，而且令人有点难受。你拍了一张照片，压缩一次，看起来差不多。压缩十次，细节开始模糊。压缩一百次，像素化成一团色块，但轮廓还在，你还认得出这是张脸。LLM对文本做的事情与此惊人地相似——语气、细节、个人声音，在一次次"优化"中被平滑掉，留下的是更流畅但更无个性的版本。最讽刺的发现是工具使用无法防止退化，也就是说，让AI先读原文再改写，还是会消融。这说明问题不在于AI有没有看到原文，而在于它处理信息的方式本身就是有损压缩。如果你在乎文字里的每一粒盐，就不要让AI反复翻炒。

来源：Hacker News · rbanffy · May 9, 08:44

原文链接：https://arxiv.org/abs/2604.15597

六、其他值得关注的动态

1. Claude Code的设计哲学分析：为什么完美AI Agent不存在。 文章系统审视了Claude Code的架构，讨论了自主性与控制、速度与准确性、通用性与专业性等根本性权衡。

承认不完美，反而是一种诚实。AI Agent的设计不是追求全能，而是在约束条件下做出最优妥协。能把自己的局限说清楚的产品，通常比声称无所不能的产品更值得信任。

来源：RSS · 量子位 · May 9, 03:18

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247889444&idx=3&sn=db42e6bfd193cb5b0d2150a3ac90b64d

2. Meta的AI战略让员工苦不堪言，《纽约时报》报道员工普遍不满，感到压力巨大。扎克伯格身边据报道都是唯唯诺诺的人。

800亿美元元宇宙押注的前车之鉴犹在。当CEO的AI执念与员工福祉冲突，创新可能正在被恐惧取代。一个人人都说"对对对"的公司，很难做出真正好的产品，因为好的产品需要有人说"不对不对"。

来源：Hacker News · JumpCrisscross · May 9, 18:33

原文链接：https://www.nytimes.com/2026/05/08/technology/meta-ai-employees-miserable.html

3. 割草机器人公司长曜创新完成A+轮融资，半年累计超亿元，新款Tron Ultra获欧洲数亿元意向订单。四轮独立驱动与转向系统可原地自转、横向平移，消除割草死角。北美割草机器人渗透率不足2%。

在大模型烧钱大战的喧嚣里，一台能横向平移的割草机器人安静地拿下了欧洲数亿元意向订单。不是所有AI故事都需要GPU集群，有时候把草割好就够了。渗透率2%意味着98%的增长空间，这个数字在任何行业都是投资人最喜欢的那种开场白。

来源：RSS · 36氪 · May 10, 01:27

原文链接：https://36kr.com/p/3801745491943169?f=rss