500亿融资砸出中国AI新王者,微软离婚OpenAI后火力全开,ChatGPT月活破10亿只用了两年半

欢迎来到StarAI日报，请查收今日最新日报。

今天的AI圈可以用三个字概括：炸了。DeepSeek拿着500亿首轮融资杀进来，腾讯和宁德时代一起押注；微软跟OpenAI正式"离婚"，一口气发了7个自研模型；ChatGPT月活破了10亿，成了人类历史上增长最快的消费级应用。信息量非常大，咱们一个一个说。

今日速览：

• DeepSeek首轮融资500亿元，估值破4000亿，腾讯宁德时代联手下注——这是中国AI领域单笔最大的融资之一
• 微软Build大会甩出7个自研模型，跟OpenAI正面开战——曾经最亲密的合作伙伴，现在成了对手
• ChatGPT月活突破10亿，只用了2.5年——比TikTok快了一倍
• MiniMax M3解码加速15.6倍，百万级上下文不再是纸面参数——开源模型首次在编程、长上下文、多模态三个维度同时追平闭源前沿
• OpenClaw 2026.6.1发布，新增Windows节点和技能工坊——AI Agent框架正在从"工具"变成"平台"

一、DeepSeek 500亿首轮融资：中国AI的"华为时刻"

DeepSeek终于融资了。

这个从2023年成立以来就一直"用爱发电"的AI公司，终于在今天宣布了首轮融资：约500亿元人民币，投后估值3500亿到4000亿元。

先说说这笔钱从哪来。创始人梁文峰自己掏了200亿，占了40%。腾讯投了100亿，宁德时代投了50亿。注意这个组合——一个是社交和游戏巨头，一个是新能源电池巨头。一个代表互联网生态，一个代表实体制造业。两个完全不同领域的企业，同时押注DeepSeek，这本身就说明了问题。

DeepSeek到底强在哪？

打个比方，如果把训练一个大模型比作盖一栋楼，OpenAI和Anthropic用的是"砸钱堆料"的方式——花几十亿美元买最好的GPU、用最多的数据、请最贵的工程师。DeepSeek的路子完全不同，更像是小米早期的"极致性价比"路线。

DeepSeek-V3的训练成本只有大约557万美元，而同级别的Llama 3 405B花了差不多5000万美元。成本是人家的十分之一。怎么做到的？核心是两个原创技术。

第一个叫MLA，全称Multi-head Latent Attention。你可以理解为一种"压缩术"——传统模型在处理长文本时，需要把所有中间结果都存在显存里，就像你写作业要把所有草稿纸都摊在桌上。MLA的做法是把草稿纸压缩成便签纸，信息量没少，但占用的空间小了十倍都不止。

第二个叫DeepSeekMoE，是一种"专家分工"架构。想象一个公司有6710个员工，但每次干活只需要370个人上场。这样既保证了公司的知识储备足够大，又不需要每次都全员出动，效率极高。

更关键的是DeepSeek-R1。这个模型用纯强化学习的方式，让模型自己学会"思考"。不靠人工标注数据，不靠模仿其他模型，就是让模型自己试错、自己总结。最终在数学、编程、科学推理这些硬核任务上，达到了OpenAI o1的水平。

这笔融资意味着什么？

对中国AI行业来说，这是一个里程碑。DeepSeek此前从未融资，靠的是梁文峰自己的钱和幻方量化的利润。现在引入外部资本，说明它准备从"技术极客"转向"商业公司"。

对腾讯来说，这是一笔"防御+进攻"的投资。腾讯自己的混元大模型在国内排名靠后，投DeepSeek可以拿到顶级技术合作的机会，同时防止DeepSeek被阿里、字节抢走。

对宁德时代来说，这是制造业拥抱AI的信号。电池研发、材料科学、储能管理，这些都需要AI能力。50亿对万亿市值的宁德时代来说只是零花钱，但这个信号很重要。

当然也有风险。3500亿到4000亿的估值，商业化路径还不清晰。OpenAI有订阅收入，Anthropic有企业客户，DeepSeek目前主要靠开源社区的影响力。能不能把技术优势转化为商业收入，是接下来最大的挑战。

二、微软与OpenAI"离婚"：曾经最亲密的合作伙伴，现在要正面开打了

微软和OpenAI的关系，终于走到了尽头。

事情的标志性节点是2026年4月27日，双方重新谈判了合同。原来的核心条款全部作废——OpenAI不再被锁定在Azure上，可以在任何云平台提供服务；原来的"AGI条款"被废除，这意味着微软不再受制于OpenAI宣布AGI后可能终止合作的限制。

用大白话说就是：以前微软是OpenAI的"独家金主"，现在变成了"普通投资人"。

微软为什么敢"离婚"？

因为微软已经有了自己的底牌。在刚刚结束的Build 2026大会上，微软一口气发布了7个自研AI模型，其中最重要的是MAI-Thinking-1——这是微软第一个从零训练的推理模型。

微软AI主管Mustafa Suleyman说了一句很关键的话："我们的目标是证明我们能成为世界顶级四大实验室之一。目前有三家：Google DeepMind、OpenAI、Anthropic。我们还不是其中之一。"

这个表态很有意思。它既承认了微软在AI领域的落后，又表明了追赶的决心。Suleyman是前DeepMind联合创始人，他被微软挖来就是要做这件事。

微软的"超级应用"野心

除了模型，微软还发布了Copilot超级应用和Scout个人助手。Scout是一个"始终在线"的AI代理，可以连接你的邮箱、日历、Teams，帮你处理日常事务。它内置了策略合规系统，每次操作都有审计轨迹——这是专门给企业客户准备的。

说白了，微软的策略是：我不跟你比谁的模型更聪明，我跟你比谁的企业服务更好。微软有全球最大的企业客户基础，有Azure云，有Windows，有Office。把这些跟AI深度整合，就是护城河。

对行业的影响

这意味着AI行业正式进入"战国时代"。以前是OpenAI领先，其他人追赶。现在是OpenAI、Anthropic、Google DeepMind、微软四强并立，再加上中国的DeepSeek、MiniMax等玩家。

对开发者来说，选择变多了，但也更复杂了。以前绑定OpenAI就行，现在要考虑多个模型、多个平台、多个定价策略。

对普通用户来说，竞争意味着更好的产品和更低的价格。微软和OpenAI的竞争，最终受益的是用户。

三、ChatGPT月活破10亿：人类历史上增长最快的消费级应用

ChatGPT只用了2.5年，月活就突破了10亿。

做个对比：TikTok用了5年，WhatsApp用了7年，Instagram用了7.5年，YouTube用了8年，Facebook用了8.5年。ChatGPT的速度是TikTok的两倍。

为什么这么快？因为ChatGPT跟社交应用不一样。社交应用需要"网络效应"——你的朋友都在用，你才愿意用。ChatGPT是工具型产品，每个人独立使用就能获得价值，不需要等别人。

Claude的增长更惊人

在ChatGPT突破10亿月活的同时，Anthropic的Claude月活达到了5600万。看起来差距很大，但Claude的同比增长率是640%，而ChatGPT大约是150%。

换句话说，Claude还在高速增长的早期阶段，市场渗透率远未饱和。而且Claude已经在编码能力上被认为是最强的——Sonnet 4被很多开发者称为"编码之王"。

IPO赛道同时开启

更值得关注的是，Anthropic已经秘密递交了IPO申请，预计2025年下半年到2026年上市，最新估值约600到615亿美元。OpenAI也完成了营利化转型，估值约3000亿美元，也在筹备上市。

两家公司同时冲刺IPO，这在科技史上很罕见。它说明AI赛道的商业化已经到了临界点——投资人需要退出渠道，公司需要更多资金扩张。

对从业者的影响

如果你是开发者，现在是最好的时代。模型能力在飞速提升，价格在持续下降，工具链在不断完善。但同时也是最焦虑的时代——你今天学的框架，明天可能就过时了。

如果你是创业者，窗口期在收窄。头部玩家的生态越来越完善，留给独立开发者的机会在变少。但在垂直领域，仍然有大量的机会。

重要动态

四、MiniMax M3：开源模型的"逆袭时刻"

MiniMax M3可能是今天最被低估的新闻。

这个模型做了一件以前只有闭源模型才能做到的事：同时拥有前沿编程能力、百万级上下文窗口、原生多模态支持。而且它是开源的。

核心突破是MSA架构——MiniMax Sparse Attention。传统注意力机制在处理100万token时，计算量会爆炸式增长。MSA的做法是"跳站快车"：只在关键token上停留，其余飞速掠过。结果是100万token的解码速度提升了15.6倍。

在编程能力上，M3在SWE-Bench Pro上拿到了59.0%的成绩，超过了GPT-5.5和Gemini 3.1 Pro。这意味着在真实世界的代码修复任务上，M3已经进入了第一梯队。

定价也很有冲击力。MiniMax的Token Plan是20美元一个月，大约能用17亿token。同样的价格在Claude Pro上只能用它的十分之一。这不是补贴烧钱，而是MSA架构带来的根本性成本优势。

打个比方，如果说闭源模型是"专卖店"，MiniMax M3就是"批发市场"——东西一样好，但价格便宜十倍。

五、OpenClaw 2026.6.1：AI Agent框架的"全栈化"

OpenClaw今天发布了2026.6.1版本，三个核心更新值得关注。

第一个是原生Windows节点。以前OpenClaw的节点系统主要面向macOS和iOS，现在Windows也加入了。这意味着你可以把Windows电脑变成AI Agent的"手脚"——主Agent在云端推理，节点在本地执行命令、操作文件、录制屏幕。

第二个是技能工坊。这是OpenClaw最有差异化的创新。传统AI框架的工具是开发者预先定义好的，Agent只能被动使用。技能工坊让Agent可以自己发现需求、创建新技能、审查安全性、安装使用。就像一个会自己找积木、自己拼装的机器人。

第三个是工作板编排。这是一种可视化的多Agent协作机制，类似Jira看板加Airflow DAG。Agent可以在工作板上领取任务、协作执行、汇报进度。

这次更新还加入了对MiniMax M3的支持。M3的Agent能力评测分数是最高的，跟OpenClaw的框架天然契合。

对AI从业者来说，这说明Agent框架正在从"单一工具"向"全栈平台"演进。未来的竞争不是谁的模型更聪明，而是谁的生态更完整。

六、Miso One：开源语音克隆的新标杆

一个8B参数的开源TTS模型，推理延迟只有110毫秒，支持一次语音克隆——只需要一个短样本就能复制你的声音。

这个模型叫Miso One，今天正式发布。它的定位是"模拟真实人类朗读的温暖与节奏"，不是那种冷冰冰的机器语音。模型权重已经开源到GitHub，可以自托管，音频数据不需要离开本地。

对内容创作者来说，这是一个好消息。以前语音克隆需要大量样本和复杂的训练过程，现在只需要一段录音就行。而且开源意味着你可以完全控制自己的声音数据，不用担心隐私问题。

七、黄仁勋与纳德拉共议智能体AI时代

在台北的微软Build大会上，黄仁勋和纳德拉同台讨论了智能体AI的未来。

这个画面本身就很有象征意义——全球最大的GPU制造商和最大的软件公司的掌门人，一起站台讨论AI Agent。说明智能体已经不再是实验室的概念，而是产业界公认的下一个主战场。

两人的共识是：AI正在从"工具"变成"同事"。未来的软件不是你告诉它做什么，而是它自己知道该做什么。这跟OpenClaw的技能工坊、微软的Scout代理、以及各种Agent框架的发展方向完全一致。

值得一看

欧盟公布技术主权计划：欧盟要扩大本土半导体、AI和云计算供应链，减少对美国和亚洲的依赖。芯片制造、AI基础设施、云计算服务都在计划范围内。地缘政治正在深刻影响AI产业的格局。

Suno完成4亿美元D轮融资：AI音乐生成平台Suno估值达到54亿美元。它的使命是让更多人能体验制作音乐的乐趣。从文本到音乐，AI正在降低所有创作形式的门槛。

Anthropic用Claude赋能自助数据分析：Anthropic使用Claude自动化了95%的业务分析查询，准确率约95%。关键在于构建了"智能体分析栈"，通过数据基础层、验证流程和技能系统解决三大错误来源。企业内部的AI应用正在从"聊天机器人"升级为"数据分析师"。

Karpathy的llm-wiki项目获超五千星：前OpenAI成员Karpathy的项目，让LLM构建并维护一个维基，每次使用都会变得更智能。核心理念是：停止在每个会话中重新发现知识。

今日话题

今天最值得讨论的问题是：DeepSeek拿了500亿之后，会不会改变它的开源策略？

梁文峰自己出了200亿，占了40%。腾讯和宁德时代各出了100亿和50亿。投资人需要回报，而开源模型的商业化一直是个难题。DeepSeek此前的影响力很大程度上来自开源——V3和R1都是开源权重的。如果为了商业化而收紧开源策略，会不会失去核心竞争力？

反过来想，如果DeepSeek坚持开源，那这500亿怎么赚回来？靠API？靠企业定制？靠生态分成？

欢迎在评论区说说你的看法。