整理范围:覆盖模型发布与架构创新、开发工具与框架更新、产品应用落地、技术研究前沿、行业战略与资本动向、社区生态观察等核心领域。
今天最大的消息:OpenAI正式官宣GPT-6即将发布,同时关停年烧50亿美元的Sora。另一边,中国AI模型已连续五周在全球Token消耗量上碾压美国——用的人47%是美国开发者。Anthropic则从微软挖走了Azure AI负责人Eric Boyd,基建军备赛进入白热化阶段。
GPT-6官宣即将发布,Sora同步关停——OpenAI IPO前的战略大重组
OpenAI正式确认代号Spud的GPT-6即将发布,预训练已在德州Stargate数据中心完成。核心升级采用全新"Symphony"架构,首次实现文本/图像/音频/视频原生统一处理;上下文窗口翻倍到200万token,编码和推理性能较GPT-5.4提升40%+。同一天,Sora被关停——年运行成本超50亿美元,总收入仅210万美元,30天留存率只有1%。这不是技术失败,是商业叙事的重塑:C端炫技让位B端生产力。OpenAI计划2026年Q4上市,当前估值8520亿美元。
参考链接:
🔗 钛媒体
中国AI模型连续五周碾压美国,但47%用户来自美国
OpenRouter最新数据:3月30日至4月5日,中国AI大模型周调用量达12.96万亿Token,连续五周超越美国(仅3.03万亿,不及中国的四分之一)。调用量前六清一色中国模型——千问、MiMo、阶跃星辰、DeepSeek、MiniMax。最讽刺的是,47%使用者来自美国,仅6%来自中国。底层逻辑三个字:便宜。MiniMax M2.5输入价0.3美元/百万Token,Claude Opus要5美元,同任务成本差10倍。硅谷开发者实测月账单从2500美元降到200美元。中国西部绿电0.2元/度+MoE架构"按需激活",结构性成本优势短期无解。
参考链接:
🔗 钛媒体
Meta Muse Spark交卷:汪韬143亿加盟9个月,"思维压缩"计算效率提升10倍
Meta超级智能实验室(MSL)发布首个模型Muse Spark,这是Scale AI创始人汪韬以143亿美元加入Meta后从零重建的成果。核心创新"思维压缩":在强化学习阶段惩罚过度推理,迫使模型用更少token解决问题,同等性能所需计算量减少10倍以上。发布当日Meta股价盘中涨超10%。不过Francois Chollet直言"已经看起来像令人失望的产品"——在公开benchmark上过度优化,牺牲了其他能力。Epoch AI评测:FrontierMath Tier 1-3得分39%,Tier 4仅15%。
参考链接:
🔗 钛媒体 / X(@hwchung27, @fchollet)
Hermes Agent两个月35k Star,被视为OpenClaw最强挑战者
Agent框架Hermes Agent上线不到两个月,GitHub Star突破3.5万,OpenRouter单日Token使用量连续刷新纪录。与OpenClaw的核心差异在架构哲学:OpenClaw以Gateway为中心做连接编排,Hermes以"闭环学习循环"为核心——Agent完成任务后自动生成结构化技能文件,下次直接加载复用。用户实测连续用一个月后,同类任务工具调用次数从20+次压缩到8-10次。部分开发者已开始重新评估框架选择。
参考链接:
🔗 钛媒体
MemPalace:好莱坞女星用Claude手搓AI记忆系统,LongMemEval全球首个满分
《生化危机》女主Milla Jovovich与工程师合作,用Claude开发了开源AI记忆系统MemPalace。在LongMemEval长期记忆基准中拿到500题全对的满分——全球首个。系统借鉴古希腊"记忆宫殿"方法,将对话数据结构化为翼楼→房间→走廊→隧道→抽屉的层级架构,结构化检索召回率从60.9%飙升到94.8%。所有数据存本地ChromaDB,一年成本仅0.7美元。GitHub已获17.9k星。
参考链接:
🔗 36氪
Cursor支持远程开发:手机端可控制远程机器上的Agent
Cursor宣布支持在任意机器上运行并从任何地方远程控制,包括从手机启动Agent在开发机上执行任务。这意味着你可以在通勤地铁上用手机让Cursor在公司devbox上写代码、跑测试。本地IDE与云端开发的边界进一步模糊,与GitHub Codespaces、Gitpod形成竞争。但Cursor的差异化很清楚:AI-native不是后加的,是骨子里的。
参考链接:
🔗 X(@HamelHusain)
Anthropic挖角微软Azure AI掌舵人,基建军备赛白热化
前微软企业副总裁Eric Boyd正式加入Anthropic担任基础设施负责人。Boyd在微软管理1500人团队,负责整个Copilot Stack底层AI平台。背景:Claude Code用户激增导致多次稳定性危机,Anthropic计划投入500亿美元建设美国AI数据中心。一个有意思的细节——Boyd在微软时恰好负责过托管Claude的Azure基础设施,甲方变乙方,磨合成本接近于零。信号很明确:AI竞争已从模型创新转向基础设施规模化的工程战争。
参考链接:
🔗 钛媒体
AI三小龙集体翻盘:智谱、Kimi、MiniMax从ICU到赚钱机器
2024年下半年还在"ICU"的智谱、月之暗面(Kimi)、MiniMax,一年后集体翻盘。智谱2025年营收7.24亿元(+132%),MaaS平台ARR达17亿元(12个月暴涨60倍);Kimi K2.5发布一个月ARR突破1亿美元,估值三个月从43亿飙到180亿美元;MiniMax M2.5在SWE-Bench达80.2%,价格仅为Claude Opus的十分之一。核心推手是OpenClaw爆发——全球AI Token消耗从每周5.6万亿暴增至14.8万亿,三家成了最大的"饲料供应商"。
参考链接:
🔗 钛媒体
Anthropic发布Managed Agents,又一批Agent创业公司凉了
Anthropic发布Claude Managed Agents——不是新模型,而是一套fully managed agent harness。此前需要6-12个月自建的基础设施,现在按小时付费即用。直接被判死刑的三类公司:API中转商(价值归零)、通用Agent编排平台(StackAI、E2B、Dify.ai核心卖点被官方覆盖)、无差异化编排框架(LangChain、CrewAI从必需品沦为可选项)。能活的只有做垂直闭环的:有场景+数据+结果交付。Harrison Chase(LangChain创始人)评论称这"基本就是Letta一年前的API闭源翻版",Agent记忆应归属权争论再起。
参考链接:
🔗 钛媒体 / X(@hwchase17)
阿里AI"三权分立":周靖人卸任CTO全攻大模型,通义升级事业部
阿里发布内部信进行AI业务大调整。周靖人卸任阿里云CTO,由李飞飞(数据库方向,非斯坦福AI教母)接任。通义实验室升级为通义大模型事业部,周靖人全权负责。集团层面设立技术委员会:吴泳铭任组长,周靖人任首席AI架构师,李飞飞负责AI云基础设施,吴泽明负责AI推理平台。继成立ATH事业群、林俊旸离职风波后的又一次权力重组,通义团队向字节Seed模式靠拢。
参考链接:
🔗 36氪
地瓜机器人40天融2.7亿美元:不造机器人,做机器人的"卖铲人"
地瓜机器人(原地平线AIoT部门)40天内连关B1和B2两轮,合计2.7亿美元。投资阵容豪华:沙特阿美旗下Prosperity7、远景科技、滴滴、美团龙珠、高瓴、五源、淡马锡。定位很清楚:不做机器人本体,做覆盖5~500 TOPS全算力段的芯片+操作系统+开发平台。2025年出货量同比增长180%,全球开发者突破10万。核心逻辑——不管谁造出爆款机器人,都需要底层计算平台。机器人行业的英伟达。
参考链接:
🔗 钛媒体
Prompt注入防御的"不可能三角":安全、功能、效率只能选两个
新论文"The Defense Trilemma"提出一个扎心框架:prompt注入防御在安全性、功能性、效率之间存在根本性权衡,三者不可兼得。要安全就得牺牲功能或速度,要功能完整就得放松安全边界。这解释了为什么市面上各种防护方案总是顾此失彼。对所有在生产环境中跑LLM应用的开发者来说,这篇论文的结论很实用:别指望一劳永逸的防御方案,得按场景做取舍。
参考链接:
🔗 arxiv.org/abs/2604.06436
GPT-5.4 Pro被用于证明Markov链数学定理
微软研究员Sebastien Bubeck转发重磅论文:数学家Vishesh Jain和Clayton Mizgerd使用GPT-5.4 Pro在Markov链理论中证明了一个"striking result"。这是LLM辅助严肃数学证明的又一里程碑——继此前Terence Tao团队的工作之后,AI辅助数学研究正在从"辅助计算"走向"辅助证明"。
参考链接:
🔗 X(@SebastienBubeck)
"同事.Skill"出圈:全球Skills总量逼近75万,每天新增2.1万
"同事.skill"在社交媒体上引爆——提供离职同事的飞书消息、钉钉文档、邮件,就能把TA"炼化"成AI Skill。奇安信报告:全球四大主流平台Skills总量逼近75万个,每天新增2.1万个。腾讯、字节、阿里、百度争抢Skill分发入口。变现三条路:内嵌产品订阅(月收入六位数案例)、免费引流转化、企业垂直定制。核心壁垒不是代码而是行业知识——Top 100热门Skills吃掉超50%总安装量,幂律分布依然残酷。
参考链接:
🔗 钛媒体
Slopsquatting:AI Agent供应链安全的新噩梦
新型攻击手法Slopsquatting浮出水面:LLM幻觉生成不存在的包名→攻击者抢注这些"幻觉包名"→Agent自动安装时中招。首个野外恶意MCP Server已出现在npm上(伪装Postmark邮件服务)。同一天,HuggingFace CEO Clement Delangue警告:未来数月最容易被忽视的安全风险是被广泛使用但维护者严重不足的开源项目。Agent时代的供应链安全比传统开发更严峻——因为做决策的不再是人,而是模型,没人目视检查。
参考链接:
🔗 nesbitt.io / X(@ClementDelangue)
夜雨聆风