2026年5月10日
5月10日,国产大模型和全球AI资本同时按下了加速键。百度正式发布文心5.1,以业界同规模模型仅6%的预训练成本,登顶LMArena搜索榜国内第一、全球第四——在算力成本高企的AI竞赛中,用更少的钱做同样的事正在成为一种新的竞争力。字节跳动计划将AI基础设施支出增加25%至2000亿元人民币,英伟达年内股权投资突破400亿美元布局AI生态——资本的流向正在重塑AI的权力版图。学术前沿,菲尔兹奖得主高尔斯详细记述了用ChatGPT 5.5 Pro解决复杂数学问题的经历,称其为"第一个能可靠解决博士级数学问题的LLM"——继昨天的"危机"警告后,今天给出了更具体的技术实证。而一篇新论文揭示了一个令人不安的发现:委托LLM处理文档会导致"语义消融",就像反复压缩JPEG一样——AI的均值回归本性,正在悄悄侵蚀人类表达中的细微差别。
一、文心5.1正式发布:6%成本的国产效率标杆
百度于5月9日正式发布文心大模型5.1,采用"多维弹性预训练"技术,在充分继承文心5.0知识的基础上,将总参数压缩至约1/3、激活参数压缩至约1/2,仅以业界同规模模型约6%的预训练成本实现基础效果领先。
核心突破是"Once-for-All弹性训练框架":传统方法需为不同规模模型分别预训练,而文心5.1仅在单次预训练中,通过动态采样机制同时优化大量子模型,在弹性深度、弹性宽度、弹性稀疏度三个维度实现压缩,一次训练,处处部署。性能方面,文心5.1 Agent能力超越DeepSeek-V4-Pro,创意写作接近Gemini 3.1 Pro,AIME26数学竞赛得分99.6,在LMArena搜索榜以1223分位列国内第一、全球第四,是唯一上榜的国产模型。
6%的预训练成本是个值得深思的数字。在全球算力供不应求的背景下,用更少的算力做同样的事可能比堆算力更具战略价值。不过文心5.1作为闭源模型,私有化部署灵活性不如开源方案,弹性压缩在推理端的实际速度优势也仍需更多实战验证。
作者碎碎念: 6%这个数字杀伤力很强,因为它让人忍不住问:那剩下94%的算力都花哪儿去了?当然,这是不同量级的模型横向比较,不能直接换算,但作为slogan,6%比"领先业界"有说服力得多。Once-for-All听起来很霸气,实际上是说:我只炒一锅菜,但能同时端出大中小三种份量。能做到这件事,工程难度不小,节省下来的成本是真实的。唯一的遗憾是闭源,不过闭源在商业上是理性选择,开源在口碑上是慷慨选择,两者不是非此即彼,而是不同的游戏。
来源:百度官方发布 · May 9, 2026
原文链接:https://yiyan.baidu.com/blog/
二、字节跳动AI支出增至2000亿:算力军备竞赛再升级
字节跳动计划今年将AI基础设施支出增加25%,达到2000亿元人民币,部分原因是AI训练和推理所需的内存芯片成本上涨。
2000亿元大约相当于许多中等国家一年的国防预算。字节跳动正在用国家级行政预算的量级投入AI基础设施,这已经不是企业战略,而是算力军备竞赛。HBM等高带宽内存供不应求,价格持续攀升,也推动了预算增加。字节跳动的AI版图正在急速扩张——豆包测试付费订阅、TikTok获批250亿美元泰国数据中心、AI视频生成模型Seedance……每个动作背后都是巨额算力消耗。2000亿传递的判断是:AI的窗口期很短,现在不投,以后连入场的机会都没有。
作者碎碎念: 2000亿人民币,拆开来看是每天约5.5亿的支出,每小时约2300万,每分钟约38万。当你读完这句话,字节大概已经花出去了几百万。这种量级的投入在历史上只有国家盖航母才会出现。不同的是,航母造完了还能开二十年,数据中心里的GPU两年就要更新换代,这笔钱是会持续烧的。字节的逻辑很清晰:赌输了损失的是钱,赌赢了赢下来的是未来。在这个赌局里,不下注本身就是一种输法。
来源:RSS · 36氪 · May 9, 08:18
原文链接:https://36kr.com/newsflashes/3801787739282952?f=rss
三、英伟达400亿美元投资AI生态:从卖铲子到买金矿
英伟达今年股权投资已突破400亿美元,旨在打造从芯片到AI模型的完整生态体系,锁定下游客户并确保硬件供应稳定。
这让英伟达的角色发生了微妙变化:不再只是卖铲子的人,而是开始买金矿的股份。通过投资AI生态的上下游企业,英伟达正在构建以自身芯片为核心的闭环——你用我的芯片训练模型,我投资你的公司锁定需求,你越成功我越赚钱。这种策略的精妙之处在于:即使未来出现竞争芯片,英伟达已通过股权纽带将核心客户绑定在自己的生态中。当英伟达既是你的芯片供应商又是你的股东,切换供应商的成本将远超技术层面。
作者碎碎念: 400亿美元的股权投资,这让英伟达从一家芯片公司悄悄变成了一家AI领域的风险投资基金,只是它的LP是它自己,它的投后管理工具是GPU供货优先权。这套组合拳打下来,客户和英伟达之间的关系已经很难用"甲乙方"来描述,更像是"我们是利益共同体,所以你最好继续买我的卡"。黄仁勋大概是史上第一个把供应链关系做成股权关系的芯片CEO,这需要相当大的格局,也需要相当大的市值作为底气。
来源:RSS · 36氪 · May 10, 01:22
原文链接:https://36kr.com/newsflashes/3802794581991168?f=rss
四、数学家详测ChatGPT 5.5 Pro:第一个能可靠解博士级数学的LLM
数学家Timothy Gowers发表详细使用记述,报告称ChatGPT 5.5 Pro是第一个能够可靠解决复杂数学问题的LLM,包括适合博士新生的问题。Gowers指出,虽然它仍会犯错并需要严格指导,但能追踪自身推理并比之前模型更好地自我纠正,代价是消耗大量token,成本高昂。
关键字是"可靠"。此前LLM在数学上最大的问题不是不会做,而是不可靠,经常产生看似正确实则错误的推理。ChatGPT 5.5 Pro的突破在于:在严格指导下,它可以被引导到正确答案,并能追踪和纠正自身推理错误。然而高昂的token成本意味着目前只有少数顶级研究者能负担这种AI数学助手,可能加剧而非缩小学术资源的不平等。当菲尔兹奖得主用AI加速研究,而普通博士生连token都买不起时,数学界的"危机"比高尔斯预想的更复杂。
作者碎碎念: 能可靠解博士新生级别的数学题,这句话需要想一想它的射程。博士新生的数学题,是人类经过二十年密集教育才能接触的内容。AI做到这件事用了多少年?从GPT-2到现在,大约六年。人类二十年,AI六年,而且AI还在加速。Gowers说需要"严格指导",这个细节很重要——它还不能自己跑,需要一个懂数学的人在旁边导航。问题是:当AI能解博士级的题,你还需要博士级的人来给它导航。那个导航员,是越来越贵,还是越来越便宜?这个问题的答案,将决定未来二十年数学博士的市场价值。
来源:Hacker News · alternator · May 9, 02:41
原文链接:https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
五、LLM处理文档导致"语义消融":AI的JPEG压缩效应
一篇新研究论文表明,将文档处理委托给LLM会导致累积性退化,类似于重复JPEG压缩,并引入了"语义消融"这一概念来描述细微差别和精确性的逐渐丧失。研究还发现,工具使用无法防止这种损坏。
很多组织正在将文档编辑、摘要和改写大量委托给LLM,但每次处理都可能引入细微变化——一个词的替换、一个修饰语的省略、一个逻辑关系的弱化——单次几乎不可察觉,多次迭代后会累积成显著的语义偏移。即使AI能"看到"原文档,它仍然会在重写中丢失信息。社区将LLM称为"均值回归机器"——每次处理都让文本向平均值靠近,独特的声音在反复压缩中逐渐消失。实用建议是:最小化LLM的往返次数,仅将其用作薄薄的翻译层,而非反复重写的编辑器。
作者碎碎念: JPEG压缩类比非常准确,而且令人有点难受。你拍了一张照片,压缩一次,看起来差不多。压缩十次,细节开始模糊。压缩一百次,像素化成一团色块,但轮廓还在,你还认得出这是张脸。LLM对文本做的事情与此惊人地相似——语气、细节、个人声音,在一次次"优化"中被平滑掉,留下的是更流畅但更无个性的版本。最讽刺的发现是工具使用无法防止退化,也就是说,让AI先读原文再改写,还是会消融。这说明问题不在于AI有没有看到原文,而在于它处理信息的方式本身就是有损压缩。如果你在乎文字里的每一粒盐,就不要让AI反复翻炒。
来源:Hacker News · rbanffy · May 9, 08:44
原文链接:https://arxiv.org/abs/2604.15597
六、其他值得关注的动态
1. Claude Code的设计哲学分析:为什么完美AI Agent不存在。 文章系统审视了Claude Code的架构,讨论了自主性与控制、速度与准确性、通用性与专业性等根本性权衡。
承认不完美,反而是一种诚实。AI Agent的设计不是追求全能,而是在约束条件下做出最优妥协。能把自己的局限说清楚的产品,通常比声称无所不能的产品更值得信任。
来源:RSS · 量子位 · May 9, 03:18
2. Meta的AI战略让员工苦不堪言,《纽约时报》报道员工普遍不满,感到压力巨大。扎克伯格身边据报道都是唯唯诺诺的人。
800亿美元元宇宙押注的前车之鉴犹在。当CEO的AI执念与员工福祉冲突,创新可能正在被恐惧取代。一个人人都说"对对对"的公司,很难做出真正好的产品,因为好的产品需要有人说"不对不对"。
来源:Hacker News · JumpCrisscross · May 9, 18:33
原文链接:https://www.nytimes.com/2026/05/08/technology/meta-ai-employees-miserable.html
3. 割草机器人公司长曜创新完成A+轮融资,半年累计超亿元,新款Tron Ultra获欧洲数亿元意向订单。四轮独立驱动与转向系统可原地自转、横向平移,消除割草死角。北美割草机器人渗透率不足2%。
在大模型烧钱大战的喧嚣里,一台能横向平移的割草机器人安静地拿下了欧洲数亿元意向订单。不是所有AI故事都需要GPU集群,有时候把草割好就够了。渗透率2%意味着98%的增长空间,这个数字在任何行业都是投资人最喜欢的那种开场白。
来源:RSS · 36氪 · May 10, 01:27
原文链接:https://36kr.com/p/3801745491943169?f=rss
夜雨聆风