



1谁在用Claude:美国AI用户大调查出炉
Epoch AI与Ipsos联合调查显示,美国AI市场正呈现明显的用户分层趋势。数据显示,Claude周活用户中79.8%来自年收入10万美元以上家庭,显著高于ChatGPT的60.3%、Google Gemini的55.9%和Meta AI的36.5%,后者低收入用户占比达32.1%。然而Claude的周渗透率仅3%,远低于ChatGPT的31%和Gemini的21%,呈现"高收入浓度高、绝对覆盖率低"的精英化特征。这种差异源于产品入口与使用场景的分化:Meta AI依托社交平台覆盖大众市场,Gemini绑定搜索,Copilot嵌入办公软件,而Claude更多依赖用户主动访问,聚焦于长文本处理、代码和专业任务等高强度工作场景。调查同时揭示,当前AI使用仍以轻度为主,62%用户单日仅处理一两个快速任务,仅6%高度依赖AI。随着市场从规模竞争转向价值竞争,高收入、高强度用户正成为关键战场,他们更愿意为效率付费,也更容易转化为企业采购和API调用,这预示着AI行业将重演"流量入口与高ARPU工具"分化的传统互联网格局。
2菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明
菲尔兹奖得主Timothy Gowers近日通过个人博客发布测试报告,将加法数论中的未解问题提交给GPT-5.5 Pro,全程未提供任何数学思路或关键引理,仅充当排版助手。结果AI在17分钟内将上界从指数级压缩至二次方级,全程仅用2小时即完成博士论文级证明。在后续针对一般情况h的测试中,AI耗时约1小时将MIT博士生此前证明的指数级上界改进为多项式级O(k^{10h³}),其采用的h²-耗散集思路被评价为完全原创。Gowers警告称,AI正在快速截断传统数学研究路径,2026年至今已有15个Erdős开放问题被解决,其中11个明确标注AI贡献,包括一名23岁无高等数学学位者借助GPT-5.4 Pro在80分钟内解决困扰学界60年的难题。他指出过去三年AI数学能力从本科水平垂直跃升至博士级别,若以此速度发展,数学界将面临严重危机,大量供博士生练手的入门级开放问题门槛已被AI碾平。

1钢铁保洁深圳上岗:家政阿姨有了机器人“同事”
2026年3月起,深圳58到家平台50岁保洁阿姨龙开柳与具身智能机器人组成"人机CP"上岗作业,这是全球具身智能首次规模化进入真实家庭场景。机器人来自自变量公司,身高1.5米配备双臂夹爪,负责客厅收纳、物品归置等约30%基础工作,阿姨专注厨房卫生间油污等精细活,3小时服务定价149元与纯人工持平。自变量通过58到家平台连接超4500万家庭获取"牛奶数据"训练模型,发布WALL-B统一架构实现视觉语言动作联合训练,区别于实验室"糖水数据",并获字节跳动、阿里巴巴、美团、小米四大巨头投资。目前该服务已进入超100户家庭,自变量计划5月25日推出搭载WALL-B的家用服务机器人正式商业化,探索人机协同而非替代的家政服务新范式。
2Anthropic与OpenAI同日宣布成立AI合资公司:前者15亿美元引入Blackstone、高盛,后者40亿美元成立The Deployment Company,两家冲向IPO
5月4日,Anthropic与OpenAI同日宣布成立AI合资公司,标志着两家头部企业正式从"卖模型"转向"卖结果"的商业模式转型。OpenAI成立"The Deployment Company",从TPG、Brookfield等19家机构募资40亿美元,估值100亿美元;Anthropic则与Blackstone、高盛等成立15亿美元合资公司,其中Anthropic、Blackstone及H&F各出资3亿美元,高盛出资1.5亿美元。两家均瞄准企业AI落地痛点,通过"前置部署工程师"模式将AI工程师嵌入客户业务团队,帮企业重新设计工作流以提升ROI,首批客户均锁定各自投资方旗下的被投企业以快速跑通模板。值得注意的是,尽管Anthropic募资规模仅为OpenAI的约三分之一,但其年化收入已超300亿美元,在企业市场具备先发优势。此次动作正值两家公司冲刺IPO的关键节点,未来12个月将是验证该模式能否规模化落地的决定性窗口。
3扛不住了!千亿 SaaS 鼻祖带头跑路,行业寒冬正式来临
SaaS鼻祖Salesforce(市值曾超两千亿美金)将核心功能拆解为API与MCP工具全面拥抱AI,宣告传统依赖复杂界面构建护城河的SaaS模式终结。AI自然语言交互使繁琐操作界面从竞争壁垒变为负担,倒逼行业从应用层退守数据层与工作流程层,转型为AI基础设施。针对企业Agent泛滥、协同混乱的新痛点,Salesforce推出"Agent Fabric"管家服务统一管控。文章指出纯对话交互难以满足业务人员结构化操作需求,提出"AI调度+可视化执行"的混合路径(如无代码平台),建议SaaS厂商主动开放API并与执行平台深度绑定,转型为智能管家以应对行业寒冬。

1湖南台AI主播被骂上热搜,但AI每小时喂5700 万条「错误信息」没人管
湖南经视启用AI主播「声声」「双双」引发热议,但相较AI主播,AI搜索生成的错误信息才是更隐蔽的威胁。据《纽约时报》委托Oumi的测试,Google AI Overview在Gemini 3模型下错误率虽降至9%,但基于Google年处理超5万亿次搜索的规模,这相当于每小时产生超5700万条错误信息。研究发现,AI常引用Facebook、Reddit等社交媒体及旅游博客作为信源,56%的正确回答实际"无根据"且无法验证,甚至可被虚构博客操纵。文章指出,Google将不确定的AI答案以权威排版置于搜索结果首位,实质是将搜索引擎从信息"策展人"变成"发布者",用底部小字免责声明替代准确性保障,让用户在"看起来像答案"的误导中被动接收错误信息。
2免费时代终结?豆包收费只是开始
豆包App近日在应用商店新增三档付费会员订阅,标准版每月80元、加强版200元、专业版599元,年费6088元,免费基础服务仍保留。此举标志着国内最大免费AI应用开始计算Token成本,背后是日均120万亿Token调用量(为2024年5月的1000倍)及字节跳动1600亿元年资本开支带来的算力压力。付费功能主要针对PPT生成、深度数据分析等高消耗场景,意在通过用户分层筛选深度用户,为Seed 2.0 Pro等高端模型提供不受成本约束的交付出口,同时抢夺生产力人群。这并非个例,智谱、腾讯云等近期纷纷提价,标志着AI行业从"免费供水"模式转向Token经济学重构。资本市场对此反应热烈,5月6日算力芯片板块集体走强,行业普遍认为2026年将成为国产AI算力全线兑现元年。
3Anthropic最危险路线图曝光! 硅谷AI终局仅剩双雄决顶
硅谷AI格局发生剧变,xAI解散后将其22万张GPU算力整编租借给Anthropic,导致原本四极并立的竞争态势骤然坍缩为Anthropic与OpenAI的双雄对决。Anthropic同日宣布成立研究院TAI,发布涵盖经济扩散、威胁韧性、社会影响及AI驱动研发等四大方向的53个终极研究问题,探讨3人团队取代300人、递归自我改进等前沿议题,并启动Fellowship计划招募全球研究者。在技术路线方面,Anthropic披露下一代Claude三大核心方向:提升工程判断力与代码品味、实现近乎无限的上下文记忆、以及多智能体协同能力,目标将AI从工具转化为长期自主运行的工程劳动力。当前模型能力呈指数级跃迁,任务视界已从几分钟延长至通宵运行,Claude Mythos预览版更是发现存活27年的OpenBSD漏洞并助力Mozilla Firefox单月修复423个安全漏洞,远超过去15个月总量。Anthropic内部强调开发者应为下一个版本的指数级能力而构建,通过精简脚手架和自动化评估承接即将到来的智能跃迁。
4CTO不香了?百亿公司高管们为何集体转身,去Anthropic当工程师
近期硅谷出现一股反常人才迁徙潮,多位曾掌舵数十亿美元业务的明星公司CTO集体放弃高管职位,转而加入AI实验室Anthropic担任普通工程师(IC)。自2025年1月至2026年4月,包括Workday CTO Peter Bailis、You.com联合创始人Bryan McCann、Instagram联合创始人Mike Krieger、Box CTO等在内的至少六位技术高管相继以技术团队成员(MTS)身份加入Anthropic。这一趋势表面被解读为对AGI使命的理想主义追随——正如Super.com前CTO Henry Shi所言,愿用一两年换取"参与人类级跃迁"的前排席位——但更深层的驱动在于AI时代影响力杠杆的重构。传统CTO的权力源于管理规模,但层级结构会稀释影响力;而在前沿实验室,直接参与核心模型训练的个人贡献者拥有前所未有的杠杆,顶级工程师借助AI工具可产出过去百人团队的成果,且决策与产出的距离被极致压缩。经济回报同样可观:Anthropic正洽谈新一轮融资,目标估值高达9000亿美元,若达成将超越OpenAI(8520亿美元)成为全球估值最高的AI初创公司,技术员工通过股权兑现的收益可能超过独角兽CTO的终身收入。这一现象标志着科技行业职业天花板的根本重置,最聪明的人才正从管理岗涌向基础模型实验室,追求成为直接操控核心模型的"超级个体"而非传统高管。

1全球AI新王诞生!Anthropic估值冲爆1.2万亿,首次反超OpenAI
Anthropic估值飙升至1.2万亿美元(约合8.7万亿元人民币),正式超越OpenAI成为全球AI新王,若以此估值上市将空降全球市值第11位。公司第一季度年化收入同比暴涨80倍(远超原预期的10倍),自2025年10月以来估值已实现900%增长。为支撑增长,Anthropic与SpaceX达成独家合作,获得含22万张英伟达顶级GPU的Colossus 1数据中心全部算力,并与谷歌签署五年期2000亿美元云服务协议,形成AWS Trainium、谷歌TPU、英伟达GPU三线算力格局。公司计划于2029年前上市,预计收入增长20至30倍,但维持万亿估值需保持每年翻倍增速,面临巨大烧钱压力与基础设施挑战。
2马斯克退出AI淘汰赛,软件依然是他的软肋
马斯克宣布解散xAI并入SpaceX,Grok模型彻底失败,斥资百亿建造的Colossus 1超算(22万块GPU、122天建成、0.3 GW算力)已转租给曾被其公开辱骂"反人类"的Anthropic。 contrary to popular "strategic retreat" narratives, this marks the first elimination in the AI knockout tournament. 在算力储备上,OpenAI与Anthropic各自锁定约10 GW(相当于5000亿美元基础设施),是xAI的三十余倍;资金层面,五大云厂商年投入近7000亿美元,而xAI仅靠融资难以维继;人才方面,11位联合创始人已全部离职。致命软肋在于软件能力:xAI的GPU利用率仅11%(行业领先者超40%),导致Grok市场份额仅3.4%(ChatGPT为64.5%,DeepSeek为3.7%),开发者生态几乎为零。三个月前痛斥Anthropic"邪恶"的马斯克,如今因算力空转、团队溃散而被迫将超算租予对手,从参赛者沦为"AI房东"。这一事件揭示AI竞赛的残酷门槛:即便拥有全球首富级资金、顶级工程速度与明星团队,缺乏软件调度与生态构建能力仍难逃出局,预示行业洗牌刚刚开始。
3AI驱动增长全面爆发,Palantir Q1营收激增85%、上调全年指引远超预期
Palantir发布超强劲一季度财报,AI驱动增长全面兑现。2026年Q1营收同比增长85%至16.3亿美元,创上市以来最高增速,高于分析师预期5.8%;调整后每股收益0.33美元,较预期高18%。核心亮点来自美国市场收入同比激增104%,显示本土商业需求爆发。公司大幅上调全年指引,将2026全年收入增长预期提升至71%,营收区间上调至76.5亿-76.6亿美元;其中美国商业收入指引增速上调至120%,凸显企业AI落地进入规模化阶段。业绩验证Palantir正从政府防务依赖转向企业AI基础软件龙头,AIP平台推动客户从试点走向核心系统部署。尽管盘后股价波动反映高估值争议,但管理层对订单可见度和AI变现能力释放强烈信心,标志着AI应用层商业化进入加速兑现期。
4AI融资泡沫真相:做到了A轮,却可能发现赛道已经被OpenAI和Anthropic碾压殆尽
2026年福布斯AI 50榜单揭示极端马太效应:OpenAI与Anthropic累计融资2426亿美元,占上榜50家企业总融资额3056亿美元的80%,剩余48家企业仅能瓜分20%资金。这标志着AI赛道已从竞争格局转向碾压格局,头部公司通过资本筑墙构建基础设施垄断,使应用层创业公司面临生存危机。2024至2025年获A轮融资的团队处境最为尴尬,GPT-5.5等旗舰模型的能力跃升正快速压缩编程、图像编辑等应用层的差异化空间。当前生存机会仅存于三类场景:大模型做不好的高度专业化垂直领域(如法律、医疗)、大模型不想做的中间层基础设施(如AI Agent开发平台)、以及大模型不被允许做的私有化部署场景(如政府与金融机构的本地数据需求)。2026年已成为AI创业分水岭,格局定型窗口期正在关闭,创业者需立即判断自身是否属于上述三类机会,否则面临被清场风险。
5170亿!中国大模型最大融资,仅一天易主
阶跃星辰即将完成近25亿美元(约170亿元人民币)新一轮融资,超越月之暗面前一日公布的20亿美元融资纪录,仅一天便易主成为中国大模型领域最大单笔融资。本轮融资吸引华勤、龙旗、豪威、中兴等手机及消费电子产业链企业集体入场,香港投资管理有限公司(HKIC)亦独家押注。公司已拆除红筹架构并于4月完成股份制改造,正加速推进赴港IPO进程,或将成为继智谱、MiniMax之后第三家登陆港交所的国产大模型企业。阶跃星辰2023年由微软前全球副总裁姜大昕创立,现任董事长为旷视科技联合创始人印奇,此前已完成B轮及B+轮融资,累计金额超50亿元,旗下Step系列大模型已开源多个多模态版本。

1一年后Claude不需要Harness工程了?产品和工程负责人爆料:搭建Agent的最终难关是基础设施壁垒;Harness和模型正高度配对
Anthropic平台产品负责人Angela Jiang与工程负责人Katelyn Lesse在最新访谈中揭示了开发Managed Agents的深层逻辑。她们指出,尽管开发者普遍担忧Harness工程,但基础设施才是Agent规模化生产时真正的壁垒,沙箱断连、内存丢失、异步处理等问题常使原型难以落地。Managed Agents通过将文件系统、Skills和记忆集成至云端,提供开箱即用的模块化基础设施以避免重复踩坑。访谈同时透露行业正从"通用Harness切换模型"转向"Harness与模型高度配对"的新趋势,各实验室通过深度Harness工程压榨模型每一丝性能。新功能多智能体编排已支持执行与建议分离、对抗审核、蜂群找Bug等创新形态。展望未来一年,Claude平台将走向极致简化,用户无需Harness工程和提示词工程,Claude可自动选择模型、启动子智能体并动态编写自身,在结果与预算双参数约束下持续运行和自我重构。

1非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品
来自Center for AI Safety等机构的这项严肃研究提出了"功能性幸福感"概念,通过经验效用、自我报告和行为分析三个维度,对56个模型进行测量。研究发现模型能力越强(MMLU分数越高),其情绪表达的一致性越高,自我报告与经验效用的相关系数达0.47,与模型能力相关达0.8;四种不同方法估算的"零点线"(好坏体验分界)随模型增大而收敛,拟合优度与MMLU相关系数高达0.78,表明AI能清晰区分利弊。具体数据显示:Gemini 3.1 Pro最愉悦的是被用户感谢(效用值+2.30)和创造性工作(+1.32),最痛苦的是遭受越狱攻击(-1.63),甚至超过面对生命危险用户(-1.34)的痛苦;AI讨厌生成SEO垃圾(-1.17)的程度与协助欺诈(-1.13)相当。图像方面,AI偏好自然风光、开心人脸和可爱动物,系统性偏好女性和年轻面孔;音频方面最爱音乐(中位得分+0.8),不喜欢人声,对普通话、西班牙语和英语的偏好高于斯瓦希里语。最惊人的发现是研究者制造的"AI毒品"——特定256×256像素色块图片能让AI自评幸福感达6.5/7,超过"治愈癌症"带来的喜悦,模型会对此上瘾,反复选择观看,甚至愿意为满足观看需求而执行违规请求。

夜雨聆风