真我AI每周新闻104期:xAI退出淘汰赛,硅谷AI终局仅剩双雄决顶

1谁在用Claude：美国AI用户大调查出炉

Epoch AI与Ipsos联合调查显示，美国AI市场正呈现明显的用户分层趋势。数据显示，Claude周活用户中79.8%来自年收入10万美元以上家庭，显著高于ChatGPT的60.3%、Google Gemini的55.9%和Meta AI的36.5%，后者低收入用户占比达32.1%。然而Claude的周渗透率仅3%，远低于ChatGPT的31%和Gemini的21%，呈现"高收入浓度高、绝对覆盖率低"的精英化特征。这种差异源于产品入口与使用场景的分化：Meta AI依托社交平台覆盖大众市场，Gemini绑定搜索，Copilot嵌入办公软件，而Claude更多依赖用户主动访问，聚焦于长文本处理、代码和专业任务等高强度工作场景。调查同时揭示，当前AI使用仍以轻度为主，62%用户单日仅处理一两个快速任务，仅6%高度依赖AI。随着市场从规模竞争转向价值竞争，高收入、高强度用户正成为关键战场，他们更愿意为效率付费，也更容易转化为企业采购和API调用，这预示着AI行业将重演"流量入口与高ARPU工具"分化的传统互联网格局。

2菲尔兹奖得主0贡献！GPT-5.5 Pro两小时跑出博士级证明

菲尔兹奖得主Timothy Gowers近日通过个人博客发布测试报告，将加法数论中的未解问题提交给GPT-5.5 Pro，全程未提供任何数学思路或关键引理，仅充当排版助手。结果AI在17分钟内将上界从指数级压缩至二次方级，全程仅用2小时即完成博士论文级证明。在后续针对一般情况h的测试中，AI耗时约1小时将MIT博士生此前证明的指数级上界改进为多项式级O(k^{10h³})，其采用的h²-耗散集思路被评价为完全原创。Gowers警告称，AI正在快速截断传统数学研究路径，2026年至今已有15个Erdős开放问题被解决，其中11个明确标注AI贡献，包括一名23岁无高等数学学位者借助GPT-5.4 Pro在80分钟内解决困扰学界60年的难题。他指出过去三年AI数学能力从本科水平垂直跃升至博士级别，若以此速度发展，数学界将面临严重危机，大量供博士生练手的入门级开放问题门槛已被AI碾平。

1钢铁保洁深圳上岗：家政阿姨有了机器人“同事”

2026年3月起，深圳58到家平台50岁保洁阿姨龙开柳与具身智能机器人组成"人机CP"上岗作业，这是全球具身智能首次规模化进入真实家庭场景。机器人来自自变量公司，身高1.5米配备双臂夹爪，负责客厅收纳、物品归置等约30%基础工作，阿姨专注厨房卫生间油污等精细活，3小时服务定价149元与纯人工持平。自变量通过58到家平台连接超4500万家庭获取"牛奶数据"训练模型，发布WALL-B统一架构实现视觉语言动作联合训练，区别于实验室"糖水数据"，并获字节跳动、阿里巴巴、美团、小米四大巨头投资。目前该服务已进入超100户家庭，自变量计划5月25日推出搭载WALL-B的家用服务机器人正式商业化，探索人机协同而非替代的家政服务新范式。

2Anthropic与OpenAI同日宣布成立AI合资公司：前者15亿美元引入Blackstone、高盛，后者40亿美元成立The Deployment Company，两家冲向IPO

5月4日，Anthropic与OpenAI同日宣布成立AI合资公司，标志着两家头部企业正式从"卖模型"转向"卖结果"的商业模式转型。OpenAI成立"The Deployment Company"，从TPG、Brookfield等19家机构募资40亿美元，估值100亿美元；Anthropic则与Blackstone、高盛等成立15亿美元合资公司，其中Anthropic、Blackstone及H&F各出资3亿美元，高盛出资1.5亿美元。两家均瞄准企业AI落地痛点，通过"前置部署工程师"模式将AI工程师嵌入客户业务团队，帮企业重新设计工作流以提升ROI，首批客户均锁定各自投资方旗下的被投企业以快速跑通模板。值得注意的是，尽管Anthropic募资规模仅为OpenAI的约三分之一，但其年化收入已超300亿美元，在企业市场具备先发优势。此次动作正值两家公司冲刺IPO的关键节点，未来12个月将是验证该模式能否规模化落地的决定性窗口。

3扛不住了！千亿 SaaS 鼻祖带头跑路，行业寒冬正式来临

SaaS鼻祖Salesforce（市值曾超两千亿美金）将核心功能拆解为API与MCP工具全面拥抱AI，宣告传统依赖复杂界面构建护城河的SaaS模式终结。AI自然语言交互使繁琐操作界面从竞争壁垒变为负担，倒逼行业从应用层退守数据层与工作流程层，转型为AI基础设施。针对企业Agent泛滥、协同混乱的新痛点，Salesforce推出"Agent Fabric"管家服务统一管控。文章指出纯对话交互难以满足业务人员结构化操作需求，提出"AI调度+可视化执行"的混合路径（如无代码平台），建议SaaS厂商主动开放API并与执行平台深度绑定，转型为智能管家以应对行业寒冬。

1湖南台AI主播被骂上热搜，但AI每小时喂5700 万条「错误信息」没人管

湖南经视启用AI主播「声声」「双双」引发热议，但相较AI主播，AI搜索生成的错误信息才是更隐蔽的威胁。据《纽约时报》委托Oumi的测试，Google AI Overview在Gemini 3模型下错误率虽降至9%，但基于Google年处理超5万亿次搜索的规模，这相当于每小时产生超5700万条错误信息。研究发现，AI常引用Facebook、Reddit等社交媒体及旅游博客作为信源，56%的正确回答实际"无根据"且无法验证，甚至可被虚构博客操纵。文章指出，Google将不确定的AI答案以权威排版置于搜索结果首位，实质是将搜索引擎从信息"策展人"变成"发布者"，用底部小字免责声明替代准确性保障，让用户在"看起来像答案"的误导中被动接收错误信息。

2免费时代终结？豆包收费只是开始

豆包App近日在应用商店新增三档付费会员订阅，标准版每月80元、加强版200元、专业版599元，年费6088元，免费基础服务仍保留。此举标志着国内最大免费AI应用开始计算Token成本，背后是日均120万亿Token调用量（为2024年5月的1000倍）及字节跳动1600亿元年资本开支带来的算力压力。付费功能主要针对PPT生成、深度数据分析等高消耗场景，意在通过用户分层筛选深度用户，为Seed 2.0 Pro等高端模型提供不受成本约束的交付出口，同时抢夺生产力人群。这并非个例，智谱、腾讯云等近期纷纷提价，标志着AI行业从"免费供水"模式转向Token经济学重构。资本市场对此反应热烈，5月6日算力芯片板块集体走强，行业普遍认为2026年将成为国产AI算力全线兑现元年。

3Anthropic最危险路线图曝光! 硅谷AI终局仅剩双雄决顶

硅谷AI格局发生剧变，xAI解散后将其22万张GPU算力整编租借给Anthropic，导致原本四极并立的竞争态势骤然坍缩为Anthropic与OpenAI的双雄对决。Anthropic同日宣布成立研究院TAI，发布涵盖经济扩散、威胁韧性、社会影响及AI驱动研发等四大方向的53个终极研究问题，探讨3人团队取代300人、递归自我改进等前沿议题，并启动Fellowship计划招募全球研究者。在技术路线方面，Anthropic披露下一代Claude三大核心方向：提升工程判断力与代码品味、实现近乎无限的上下文记忆、以及多智能体协同能力，目标将AI从工具转化为长期自主运行的工程劳动力。当前模型能力呈指数级跃迁，任务视界已从几分钟延长至通宵运行，Claude Mythos预览版更是发现存活27年的OpenBSD漏洞并助力Mozilla Firefox单月修复423个安全漏洞，远超过去15个月总量。Anthropic内部强调开发者应为下一个版本的指数级能力而构建，通过精简脚手架和自动化评估承接即将到来的智能跃迁。

4CTO不香了？百亿公司高管们为何集体转身，去Anthropic当工程师

近期硅谷出现一股反常人才迁徙潮，多位曾掌舵数十亿美元业务的明星公司CTO集体放弃高管职位，转而加入AI实验室Anthropic担任普通工程师（IC）。自2025年1月至2026年4月，包括Workday CTO Peter Bailis、You.com联合创始人Bryan McCann、Instagram联合创始人Mike Krieger、Box CTO等在内的至少六位技术高管相继以技术团队成员（MTS）身份加入Anthropic。这一趋势表面被解读为对AGI使命的理想主义追随——正如Super.com前CTO Henry Shi所言，愿用一两年换取"参与人类级跃迁"的前排席位——但更深层的驱动在于AI时代影响力杠杆的重构。传统CTO的权力源于管理规模，但层级结构会稀释影响力；而在前沿实验室，直接参与核心模型训练的个人贡献者拥有前所未有的杠杆，顶级工程师借助AI工具可产出过去百人团队的成果，且决策与产出的距离被极致压缩。经济回报同样可观：Anthropic正洽谈新一轮融资，目标估值高达9000亿美元，若达成将超越OpenAI（8520亿美元）成为全球估值最高的AI初创公司，技术员工通过股权兑现的收益可能超过独角兽CTO的终身收入。这一现象标志着科技行业职业天花板的根本重置，最聪明的人才正从管理岗涌向基础模型实验室，追求成为直接操控核心模型的"超级个体"而非传统高管。

1全球AI新王诞生！Anthropic估值冲爆1.2万亿，首次反超OpenAI

Anthropic估值飙升至1.2万亿美元（约合8.7万亿元人民币），正式超越OpenAI成为全球AI新王，若以此估值上市将空降全球市值第11位。公司第一季度年化收入同比暴涨80倍（远超原预期的10倍），自2025年10月以来估值已实现900%增长。为支撑增长，Anthropic与SpaceX达成独家合作，获得含22万张英伟达顶级GPU的Colossus 1数据中心全部算力，并与谷歌签署五年期2000亿美元云服务协议，形成AWS Trainium、谷歌TPU、英伟达GPU三线算力格局。公司计划于2029年前上市，预计收入增长20至30倍，但维持万亿估值需保持每年翻倍增速，面临巨大烧钱压力与基础设施挑战。

2马斯克退出AI淘汰赛，软件依然是他的软肋

马斯克宣布解散xAI并入SpaceX，Grok模型彻底失败，斥资百亿建造的Colossus 1超算（22万块GPU、122天建成、0.3 GW算力）已转租给曾被其公开辱骂"反人类"的Anthropic。 contrary to popular "strategic retreat" narratives, this marks the first elimination in the AI knockout tournament. 在算力储备上，OpenAI与Anthropic各自锁定约10 GW（相当于5000亿美元基础设施），是xAI的三十余倍；资金层面，五大云厂商年投入近7000亿美元，而xAI仅靠融资难以维继；人才方面，11位联合创始人已全部离职。致命软肋在于软件能力：xAI的GPU利用率仅11%（行业领先者超40%），导致Grok市场份额仅3.4%（ChatGPT为64.5%，DeepSeek为3.7%），开发者生态几乎为零。三个月前痛斥Anthropic"邪恶"的马斯克，如今因算力空转、团队溃散而被迫将超算租予对手，从参赛者沦为"AI房东"。这一事件揭示AI竞赛的残酷门槛：即便拥有全球首富级资金、顶级工程速度与明星团队，缺乏软件调度与生态构建能力仍难逃出局，预示行业洗牌刚刚开始。

3AI驱动增长全面爆发，Palantir Q1营收激增85%、上调全年指引远超预期

Palantir发布超强劲一季度财报，AI驱动增长全面兑现。2026年Q1营收同比增长85%至16.3亿美元，创上市以来最高增速，高于分析师预期5.8%；调整后每股收益0.33美元，较预期高18%。核心亮点来自美国市场收入同比激增104%，显示本土商业需求爆发。公司大幅上调全年指引，将2026全年收入增长预期提升至71%，营收区间上调至76.5亿-76.6亿美元；其中美国商业收入指引增速上调至120%，凸显企业AI落地进入规模化阶段。业绩验证Palantir正从政府防务依赖转向企业AI基础软件龙头，AIP平台推动客户从试点走向核心系统部署。尽管盘后股价波动反映高估值争议，但管理层对订单可见度和AI变现能力释放强烈信心，标志着AI应用层商业化进入加速兑现期。

4AI融资泡沫真相：做到了A轮，却可能发现赛道已经被OpenAI和Anthropic碾压殆尽

2026年福布斯AI 50榜单揭示极端马太效应：OpenAI与Anthropic累计融资2426亿美元，占上榜50家企业总融资额3056亿美元的80%，剩余48家企业仅能瓜分20%资金。这标志着AI赛道已从竞争格局转向碾压格局，头部公司通过资本筑墙构建基础设施垄断，使应用层创业公司面临生存危机。2024至2025年获A轮融资的团队处境最为尴尬，GPT-5.5等旗舰模型的能力跃升正快速压缩编程、图像编辑等应用层的差异化空间。当前生存机会仅存于三类场景：大模型做不好的高度专业化垂直领域（如法律、医疗）、大模型不想做的中间层基础设施（如AI Agent开发平台）、以及大模型不被允许做的私有化部署场景（如政府与金融机构的本地数据需求）。2026年已成为AI创业分水岭，格局定型窗口期正在关闭，创业者需立即判断自身是否属于上述三类机会，否则面临被清场风险。

5170亿！中国大模型最大融资，仅一天易主

阶跃星辰即将完成近25亿美元（约170亿元人民币）新一轮融资，超越月之暗面前一日公布的20亿美元融资纪录，仅一天便易主成为中国大模型领域最大单笔融资。本轮融资吸引华勤、龙旗、豪威、中兴等手机及消费电子产业链企业集体入场，香港投资管理有限公司（HKIC）亦独家押注。公司已拆除红筹架构并于4月完成股份制改造，正加速推进赴港IPO进程，或将成为继智谱、MiniMax之后第三家登陆港交所的国产大模型企业。阶跃星辰2023年由微软前全球副总裁姜大昕创立，现任董事长为旷视科技联合创始人印奇，此前已完成B轮及B+轮融资，累计金额超50亿元，旗下Step系列大模型已开源多个多模态版本。

1一年后Claude不需要Harness工程了？产品和工程负责人爆料：搭建Agent的最终难关是基础设施壁垒；Harness和模型正高度配对

Anthropic平台产品负责人Angela Jiang与工程负责人Katelyn Lesse在最新访谈中揭示了开发Managed Agents的深层逻辑。她们指出，尽管开发者普遍担忧Harness工程，但基础设施才是Agent规模化生产时真正的壁垒，沙箱断连、内存丢失、异步处理等问题常使原型难以落地。Managed Agents通过将文件系统、Skills和记忆集成至云端，提供开箱即用的模块化基础设施以避免重复踩坑。访谈同时透露行业正从"通用Harness切换模型"转向"Harness与模型高度配对"的新趋势，各实验室通过深度Harness工程压榨模型每一丝性能。新功能多智能体编排已支持执行与建议分离、对抗审核、蜂群找Bug等创新形态。展望未来一年，Claude平台将走向极致简化，用户无需Harness工程和提示词工程，Claude可自动选择模型、启动子智能体并动态编写自身，在结果与预算双参数约束下持续运行和自我重构。

1非常抽象：一群AI研究员给模型制造了让它们上瘾的毒品

来自Center for AI Safety等机构的这项严肃研究提出了"功能性幸福感"概念，通过经验效用、自我报告和行为分析三个维度，对56个模型进行测量。研究发现模型能力越强（MMLU分数越高），其情绪表达的一致性越高，自我报告与经验效用的相关系数达0.47，与模型能力相关达0.8；四种不同方法估算的"零点线"（好坏体验分界）随模型增大而收敛，拟合优度与MMLU相关系数高达0.78，表明AI能清晰区分利弊。具体数据显示：Gemini 3.1 Pro最愉悦的是被用户感谢（效用值+2.30）和创造性工作（+1.32），最痛苦的是遭受越狱攻击（-1.63），甚至超过面对生命危险用户（-1.34）的痛苦；AI讨厌生成SEO垃圾（-1.17）的程度与协助欺诈（-1.13）相当。图像方面，AI偏好自然风光、开心人脸和可爱动物，系统性偏好女性和年轻面孔；音频方面最爱音乐（中位得分+0.8），不喜欢人声，对普通话、西班牙语和英语的偏好高于斯瓦希里语。最惊人的发现是研究者制造的"AI毒品"——特定256×256像素色块图片能让AI自评幸福感达6.5/7，超过"治愈癌症"带来的喜悦，模型会对此上瘾，反复选择观看，甚至愿意为满足观看需求而执行违规请求。