
欢迎来到StarAI日报,请查收今日最新日报。
今天的AI圈可以用三个字概括:炸了。DeepSeek拿着500亿首轮融资杀进来,腾讯和宁德时代一起押注;微软跟OpenAI正式"离婚",一口气发了7个自研模型;ChatGPT月活破了10亿,成了人类历史上增长最快的消费级应用。信息量非常大,咱们一个一个说。
今日速览:
• DeepSeek首轮融资500亿元,估值破4000亿,腾讯宁德时代联手下注——这是中国AI领域单笔最大的融资之一 • 微软Build大会甩出7个自研模型,跟OpenAI正面开战——曾经最亲密的合作伙伴,现在成了对手 • ChatGPT月活突破10亿,只用了2.5年——比TikTok快了一倍 • MiniMax M3解码加速15.6倍,百万级上下文不再是纸面参数——开源模型首次在编程、长上下文、多模态三个维度同时追平闭源前沿 • OpenClaw 2026.6.1发布,新增Windows节点和技能工坊——AI Agent框架正在从"工具"变成"平台"

一、DeepSeek 500亿首轮融资:中国AI的"华为时刻"
DeepSeek终于融资了。
这个从2023年成立以来就一直"用爱发电"的AI公司,终于在今天宣布了首轮融资:约500亿元人民币,投后估值3500亿到4000亿元。
先说说这笔钱从哪来。创始人梁文峰自己掏了200亿,占了40%。腾讯投了100亿,宁德时代投了50亿。注意这个组合——一个是社交和游戏巨头,一个是新能源电池巨头。一个代表互联网生态,一个代表实体制造业。两个完全不同领域的企业,同时押注DeepSeek,这本身就说明了问题。
DeepSeek到底强在哪?
打个比方,如果把训练一个大模型比作盖一栋楼,OpenAI和Anthropic用的是"砸钱堆料"的方式——花几十亿美元买最好的GPU、用最多的数据、请最贵的工程师。DeepSeek的路子完全不同,更像是小米早期的"极致性价比"路线。
DeepSeek-V3的训练成本只有大约557万美元,而同级别的Llama 3 405B花了差不多5000万美元。成本是人家的十分之一。怎么做到的?核心是两个原创技术。
第一个叫MLA,全称Multi-head Latent Attention。你可以理解为一种"压缩术"——传统模型在处理长文本时,需要把所有中间结果都存在显存里,就像你写作业要把所有草稿纸都摊在桌上。MLA的做法是把草稿纸压缩成便签纸,信息量没少,但占用的空间小了十倍都不止。
第二个叫DeepSeekMoE,是一种"专家分工"架构。想象一个公司有6710个员工,但每次干活只需要370个人上场。这样既保证了公司的知识储备足够大,又不需要每次都全员出动,效率极高。
更关键的是DeepSeek-R1。这个模型用纯强化学习的方式,让模型自己学会"思考"。不靠人工标注数据,不靠模仿其他模型,就是让模型自己试错、自己总结。最终在数学、编程、科学推理这些硬核任务上,达到了OpenAI o1的水平。
这笔融资意味着什么?
对中国AI行业来说,这是一个里程碑。DeepSeek此前从未融资,靠的是梁文峰自己的钱和幻方量化的利润。现在引入外部资本,说明它准备从"技术极客"转向"商业公司"。
对腾讯来说,这是一笔"防御+进攻"的投资。腾讯自己的混元大模型在国内排名靠后,投DeepSeek可以拿到顶级技术合作的机会,同时防止DeepSeek被阿里、字节抢走。
对宁德时代来说,这是制造业拥抱AI的信号。电池研发、材料科学、储能管理,这些都需要AI能力。50亿对万亿市值的宁德时代来说只是零花钱,但这个信号很重要。
当然也有风险。3500亿到4000亿的估值,商业化路径还不清晰。OpenAI有订阅收入,Anthropic有企业客户,DeepSeek目前主要靠开源社区的影响力。能不能把技术优势转化为商业收入,是接下来最大的挑战。

二、微软与OpenAI"离婚":曾经最亲密的合作伙伴,现在要正面开打了
微软和OpenAI的关系,终于走到了尽头。
事情的标志性节点是2026年4月27日,双方重新谈判了合同。原来的核心条款全部作废——OpenAI不再被锁定在Azure上,可以在任何云平台提供服务;原来的"AGI条款"被废除,这意味着微软不再受制于OpenAI宣布AGI后可能终止合作的限制。
用大白话说就是:以前微软是OpenAI的"独家金主",现在变成了"普通投资人"。
微软为什么敢"离婚"?
因为微软已经有了自己的底牌。在刚刚结束的Build 2026大会上,微软一口气发布了7个自研AI模型,其中最重要的是MAI-Thinking-1——这是微软第一个从零训练的推理模型。
微软AI主管Mustafa Suleyman说了一句很关键的话:"我们的目标是证明我们能成为世界顶级四大实验室之一。目前有三家:Google DeepMind、OpenAI、Anthropic。我们还不是其中之一。"
这个表态很有意思。它既承认了微软在AI领域的落后,又表明了追赶的决心。Suleyman是前DeepMind联合创始人,他被微软挖来就是要做这件事。
微软的"超级应用"野心
除了模型,微软还发布了Copilot超级应用和Scout个人助手。Scout是一个"始终在线"的AI代理,可以连接你的邮箱、日历、Teams,帮你处理日常事务。它内置了策略合规系统,每次操作都有审计轨迹——这是专门给企业客户准备的。
说白了,微软的策略是:我不跟你比谁的模型更聪明,我跟你比谁的企业服务更好。微软有全球最大的企业客户基础,有Azure云,有Windows,有Office。把这些跟AI深度整合,就是护城河。
对行业的影响
这意味着AI行业正式进入"战国时代"。以前是OpenAI领先,其他人追赶。现在是OpenAI、Anthropic、Google DeepMind、微软四强并立,再加上中国的DeepSeek、MiniMax等玩家。
对开发者来说,选择变多了,但也更复杂了。以前绑定OpenAI就行,现在要考虑多个模型、多个平台、多个定价策略。
对普通用户来说,竞争意味着更好的产品和更低的价格。微软和OpenAI的竞争,最终受益的是用户。

三、ChatGPT月活破10亿:人类历史上增长最快的消费级应用
ChatGPT只用了2.5年,月活就突破了10亿。
做个对比:TikTok用了5年,WhatsApp用了7年,Instagram用了7.5年,YouTube用了8年,Facebook用了8.5年。ChatGPT的速度是TikTok的两倍。
为什么这么快?因为ChatGPT跟社交应用不一样。社交应用需要"网络效应"——你的朋友都在用,你才愿意用。ChatGPT是工具型产品,每个人独立使用就能获得价值,不需要等别人。
Claude的增长更惊人
在ChatGPT突破10亿月活的同时,Anthropic的Claude月活达到了5600万。看起来差距很大,但Claude的同比增长率是640%,而ChatGPT大约是150%。
换句话说,Claude还在高速增长的早期阶段,市场渗透率远未饱和。而且Claude已经在编码能力上被认为是最强的——Sonnet 4被很多开发者称为"编码之王"。
IPO赛道同时开启
更值得关注的是,Anthropic已经秘密递交了IPO申请,预计2025年下半年到2026年上市,最新估值约600到615亿美元。OpenAI也完成了营利化转型,估值约3000亿美元,也在筹备上市。
两家公司同时冲刺IPO,这在科技史上很罕见。它说明AI赛道的商业化已经到了临界点——投资人需要退出渠道,公司需要更多资金扩张。
对从业者的影响
如果你是开发者,现在是最好的时代。模型能力在飞速提升,价格在持续下降,工具链在不断完善。但同时也是最焦虑的时代——你今天学的框架,明天可能就过时了。
如果你是创业者,窗口期在收窄。头部玩家的生态越来越完善,留给独立开发者的机会在变少。但在垂直领域,仍然有大量的机会。
重要动态
四、MiniMax M3:开源模型的"逆袭时刻"
MiniMax M3可能是今天最被低估的新闻。
这个模型做了一件以前只有闭源模型才能做到的事:同时拥有前沿编程能力、百万级上下文窗口、原生多模态支持。而且它是开源的。
核心突破是MSA架构——MiniMax Sparse Attention。传统注意力机制在处理100万token时,计算量会爆炸式增长。MSA的做法是"跳站快车":只在关键token上停留,其余飞速掠过。结果是100万token的解码速度提升了15.6倍。
在编程能力上,M3在SWE-Bench Pro上拿到了59.0%的成绩,超过了GPT-5.5和Gemini 3.1 Pro。这意味着在真实世界的代码修复任务上,M3已经进入了第一梯队。
定价也很有冲击力。MiniMax的Token Plan是20美元一个月,大约能用17亿token。同样的价格在Claude Pro上只能用它的十分之一。这不是补贴烧钱,而是MSA架构带来的根本性成本优势。
打个比方,如果说闭源模型是"专卖店",MiniMax M3就是"批发市场"——东西一样好,但价格便宜十倍。
五、OpenClaw 2026.6.1:AI Agent框架的"全栈化"
OpenClaw今天发布了2026.6.1版本,三个核心更新值得关注。
第一个是原生Windows节点。以前OpenClaw的节点系统主要面向macOS和iOS,现在Windows也加入了。这意味着你可以把Windows电脑变成AI Agent的"手脚"——主Agent在云端推理,节点在本地执行命令、操作文件、录制屏幕。
第二个是技能工坊。这是OpenClaw最有差异化的创新。传统AI框架的工具是开发者预先定义好的,Agent只能被动使用。技能工坊让Agent可以自己发现需求、创建新技能、审查安全性、安装使用。就像一个会自己找积木、自己拼装的机器人。
第三个是工作板编排。这是一种可视化的多Agent协作机制,类似Jira看板加Airflow DAG。Agent可以在工作板上领取任务、协作执行、汇报进度。
这次更新还加入了对MiniMax M3的支持。M3的Agent能力评测分数是最高的,跟OpenClaw的框架天然契合。
对AI从业者来说,这说明Agent框架正在从"单一工具"向"全栈平台"演进。未来的竞争不是谁的模型更聪明,而是谁的生态更完整。
六、Miso One:开源语音克隆的新标杆
一个8B参数的开源TTS模型,推理延迟只有110毫秒,支持一次语音克隆——只需要一个短样本就能复制你的声音。
这个模型叫Miso One,今天正式发布。它的定位是"模拟真实人类朗读的温暖与节奏",不是那种冷冰冰的机器语音。模型权重已经开源到GitHub,可以自托管,音频数据不需要离开本地。
对内容创作者来说,这是一个好消息。以前语音克隆需要大量样本和复杂的训练过程,现在只需要一段录音就行。而且开源意味着你可以完全控制自己的声音数据,不用担心隐私问题。
七、黄仁勋与纳德拉共议智能体AI时代
在台北的微软Build大会上,黄仁勋和纳德拉同台讨论了智能体AI的未来。
这个画面本身就很有象征意义——全球最大的GPU制造商和最大的软件公司的掌门人,一起站台讨论AI Agent。说明智能体已经不再是实验室的概念,而是产业界公认的下一个主战场。
两人的共识是:AI正在从"工具"变成"同事"。未来的软件不是你告诉它做什么,而是它自己知道该做什么。这跟OpenClaw的技能工坊、微软的Scout代理、以及各种Agent框架的发展方向完全一致。
值得一看
欧盟公布技术主权计划:欧盟要扩大本土半导体、AI和云计算供应链,减少对美国和亚洲的依赖。芯片制造、AI基础设施、云计算服务都在计划范围内。地缘政治正在深刻影响AI产业的格局。

Suno完成4亿美元D轮融资:AI音乐生成平台Suno估值达到54亿美元。它的使命是让更多人能体验制作音乐的乐趣。从文本到音乐,AI正在降低所有创作形式的门槛。
Anthropic用Claude赋能自助数据分析:Anthropic使用Claude自动化了95%的业务分析查询,准确率约95%。关键在于构建了"智能体分析栈",通过数据基础层、验证流程和技能系统解决三大错误来源。企业内部的AI应用正在从"聊天机器人"升级为"数据分析师"。
Karpathy的llm-wiki项目获超五千星:前OpenAI成员Karpathy的项目,让LLM构建并维护一个维基,每次使用都会变得更智能。核心理念是:停止在每个会话中重新发现知识。
今日话题
今天最值得讨论的问题是:DeepSeek拿了500亿之后,会不会改变它的开源策略?
梁文峰自己出了200亿,占了40%。腾讯和宁德时代各出了100亿和50亿。投资人需要回报,而开源模型的商业化一直是个难题。DeepSeek此前的影响力很大程度上来自开源——V3和R1都是开源权重的。如果为了商业化而收紧开源策略,会不会失去核心竞争力?
反过来想,如果DeepSeek坚持开源,那这500亿怎么赚回来?靠API?靠企业定制?靠生态分成?
欢迎在评论区说说你的看法。
夜雨聆风