AI 产业观察 · 系列第一篇
AI 产业图景:5 层蛋糕与主要玩家
这是一个系列分享的第一篇。我尝试把自己近期跟踪 AI 产业的个人观察整理出来,作为学习笔记。如有不妥,欢迎指正。
为什么要了解产业全景
目前 AI 产业发展太快了。快到什么程度?我前几天写的那篇 OpenClaw 记忆架构文章,里面不少内容现在已经过时了。
如果只记住"某个工具怎么用",这些经验很可能几周后就不适用了。但如果你对整个产业有一个大致的图景——知道有哪些玩家、它们各自在做什么、能力边界和发展方向是什么——当新东西出来的时候,你能很快判断它是什么位置、值不值得关注。
"5 层蛋糕":AI 产业的基本结构
整个 AI 产业可以想象成一个 5 层蛋糕(黄仁勋的比喻)。从底往上大致是:
5应用层 基于模型做出的各种产品和工具
4模型层 各家大模型,"大脑"本身
3基础设施(土地/供电/冷却系统/建筑工程/网络通信)
2芯片(Nvida/AMD/Google/AWS...)
1能源(电力)
对我们来说,底下三层不用特别关心——那是芯片厂和云服务商的事情。但有一点值得知道:影响模型能力和厂商服务能力的最大瓶颈就是算力,也就是底下那三层。这也是为什么"算力"这个词这两年出现频率这么高。
我们重点关注的是模型层和应用层——这两层直接决定了我们能用到什么工具、工具有多强。
国内模型厂商
性价比高,竞争激烈
第一梯队:"御三家"
国内目前有三家被业内称为"御三家"的独立模型公司,都在过去一年多密集上市和发布新模型。
MiniMax(稀宇科技)
估值 港股上市(00100.HK),市值约 2695 亿港元,2026.1.9 上市
主打模型 MiniMax M2.7(2026.3 发布,已开源),海螺系多模态模型
模型特点
自我进化能力,能自主构建 Agent Harness 优化训练流程;
200K 上下文 + Agent 多智能体协作;
软件工程能力接近顶级,价格仅 1/20;
全模态支持(文本/图像/音频/视频/音乐)
主要产品 星野 / Talkie(C 端情感陪聊)、MiniMax 开放平台、Token Plan 订阅、Maxclaw(Agent 工具)
月之暗面(Moonshot)
估值 未上市,最新估值约 180 亿美元(2026.3 融资),3 个月内翻 4 倍
主打模型 Kimi K2.5(2026.1 发布,已开源)、Kimi K2
模型特点
原生多模态架构(Native Multimodal);
原生视觉能力,直接分析复杂图像布局;
Agent Swarm 智能体集群,调度 100 个 AI 分身并行任务
较早对金融和资本市场场景进行了落地实践
主要产品 Kimi AI 助手(C 端)、Kimi API 平台(企业级)、智能体蜂群开发工具、Kimiclaw(Agent)
智谱 AI(Z.ai,清华系)
估值 港股上市(02513.HK),市值约 3972 亿港元,2026.1.8 上市
主打模型 GLM-5.1(2026.4.8 发布,已开源),与 GLM-5、GLM-5-Turbo 构成旗舰推理矩阵
模型特点
代码高手,从"分钟级交互"推进到 8 小时长程任务;
202K 上下文 + 164K 最大输出;
代码能力逼近 Opus 4.6,SWE-benchPro 基准优秀;
主打"超长文本 + 高阶推理 + 强代码"
主要产品 ChatGLM / 智谱清言(C 端)、GLM Coding Plan(开发者订阅)、智谱开放平台(企业级)、Autoclaw 澳龙(Agent)
两个不能忽视的重量级玩家
DeepSeek(深度求索)
估值 超 100 亿美元(首次对外融资,计划募资至少 3 亿美元)
主打模型 DeepSeek-V3.2(当前主力);DeepSeek-V4(待发布,万众期待)
模型特点 效率高、成本低,开源先行者。V4 据传完全基于华为芯片开发——如果属实将证明国产算力链的可行性
主要产品 DeepSeek 网站和 App、开放平台 API、政企 B 端合作
阶跃星辰(Stepfun)
估值 Pre-IPO 轮投前估值 50-60 亿美元(2026.4 交割),计划年内港股上市,目标约 100 亿美元
主打模型 StepMind 系列(Step-3.5 Flash、Step-R-mini 等),6 款多模态基座模型
模型特点 原生多模态技术壁垒,覆盖语言/图像/音频/视频全场景;推理效率极高,Token 消耗低;性价比高
主要产品 冒泡鸭(AI 互动平台)、AI 小财神(金融智能体)、Stepfun 开放平台
国内大厂:模型 + 生态的组合战
国内互联网大厂的打法和独立模型公司不同——它们有既有生态可以嫁接,走的是"模型 + 平台 + 分发渠道"三位一体的路线。
腾讯
基座是混元大模型系列,图像和视频模型深度嵌入游戏业务。
C 端结合社交生态推广元宝、IMA Copilot 和 Claw 类 Agent 产品;
B 端结合腾讯云和企微生态,Token 出售和 Agent 托管等业务发展迅猛。
对我们来说,腾讯内部提供的 AI 工具(如 WorkBuddy、qclaw 等)都是基于这条线。
阿里
Qwen3 系列(最新 Qwen3.6-plus)稳居国产第一梯队,开源战略在国内最为激进,在国际 AI 产业影响力大。
依托阿里云和钉钉,Token 出售和 Agent 部署优化等业务发展迅猛。
C 端产品重点是千问 App。
字节
Seed2.0 模型能力稳居国产第一梯队,是 C 端豆包、抖音和其他字节系产品的模型基座。
视频模型 Seedance 2.0 暂居世界第一,正在重构短剧和漫剧生态。
依托飞书和火山云,B 端 Token 出售和 Agent 部署优化业务增长很快。
一句话总结国内格局:国内模型厂商的特点是优秀的模型能力和更优秀的性价比,在全球 Token 消费中总量占比很高。但在 Agent 领域,国内模型厂商目前主要扮演上游供应商和本土场景落地者角色——真正定义通用 Agent 产品形态的力量,目前更多在海外。
美国模型厂商
第一梯队与追赶者
三家核心玩家
Google DeepMind
市值 隶属 Alphabet 集团,AI 业务独立核算,企业价值约 3400 亿美元
主打模型 Gemini 3.1 系列(Ultra / Pro / Flash / Deep Think,2026.2 发布);图像模型 Nano Banana 2 业界顶级
模型特点
多模态与长上下文是核心竞争力;
视频模型国际第一梯队;Gemini 3.1 Pro 推理能力翻倍;
AI 行业元老,在科研场景已有大量成果。
开源线Gemma 4(2026.4.2 发布),基于 Gemini 3 技术,Apache 2.0 完全开源。4 个版本(2B–31B),128K–256K 上下文,140+ 语言,原生多模态。31B 版本消费级 GPU(RTX 3090)可运行,自建年成本约 GPT-5.2 API 的 15%。业内评价"开源天花板"
主要产品 Gemini + Workspace 深度整合、NoteLLM、Google AI Studio、Google Antigravity + Gemini CLI
OpenAI
估值 未上市,最新估值约 8520 亿美元(2026.3.31 完成 1220 亿美元融资),全球估值最高的创业企业
主打模型 GPT-5 系列(2025.8 发布),主打 GPT-5.4;内测图像模型 GPT-image-2 据传将超越 Nano Banana
模型特点
业界顶级,超强推理和超低幻觉,代码能力超强。
推理有时过度,表述偏啰嗦,AI 味比较重,大局观和规划能力不如 Opus
主要产品 ChatGPT(月活全球最高)、OpenAI API(企业级)、Codex(主力 Agent 产品)
Anthropic(A 社)
AI 界目前最像 Apple 的玩家
估值 G 轮融资后估值 3800 亿美元,4 月获 8000 亿美元要约(未接受);IPO 或最早 2026.10 启动
主打模型 Claude Mythos preview(Project Glasswing 封闭测试中);Opus 4.7(4 月)/ Opus 4.6(2 月)/ Sonnet 4.6 / Haiku 4.6 等多层级
模型特点行业定义者;代码、Agent 智能体、工程能力和企业工作流方面全球领先。个人体验中综合能力最强
主要产品 Claude.ai(C 端工作站)、Claude API(企业级)、
Claude Code——最强工程 Agent,没有之一
新产品 Claude Design 将颠覆设计行业
两个值得关注的追赶者
xAI
估值 约 500 亿美元(2026.1 完成 200 亿美元 Series E,超额募资)。马斯克创办
主打模型 Grok 4.20(2026.3.19 发布),约 3 万亿参数 MoE 架构
模型特点 四 Agent 多代理协作架构(Grok / Harper / Benjamin / Lucas 四子 Agent 分工);原生 tool calling;幻觉率号称业界最低;API 降价 60%
独特优势 背靠 X 平台数据 + Colossus 超算集群 + Tesla 生态。马斯克宇宙的算力资源是最大壁垒
潜在风险 但 xAI 正经历剧烈的组织动荡——2026 年 2-3 月间,12 位创始团队成员相继离职(除马斯克外几乎全部出走),包括联合创始人吴宇怀(辛顿学生)、诺迪恩等核心研究力量。短期内对模型迭代节奏和工程稳定性的影响仍有待观察
Meta
最新动态 2026.4.8 发布 Muse Spark,超级智能实验室(MSL)成立后的首款模型,由前 Scale AI CEO Alexandr Wang 领导
模型特点 原生多模态 + 三种推理模式,历时 9 个月从零重建。关键转向:Meta 正从长期坚持的开源路线转向闭源(Llama 4 不及预期后的全面重建)
分发路径 先 meta.ai,后推送 WhatsApp、Instagram、Facebook、Messenger 和 AI 眼镜
人事与路线变动 首席 AI 科学家 Yann LeCun 于 2025 年 11 月离职创业(AMI Labs,聚焦 world models),长期坚持的 Llama 开源路线也随之被搁置——Muse Spark 全面转向闭源
关于开源的一个侧面观察
在美国厂商中,"开源"是一个有趣的变量。Google 在闭源 Gemini 之外积极推进 Gemma 系列完全开源(Apache 2.0),最新 Gemma 4 已做到消费级硬件流畅运行,性价比极高。而 Meta 则走了相反的路:从 Llama 的长期开源转向 Muse Spark 的闭源。这说明"开源 vs 闭源"不是简单的价值判断,更多是不同阶段、不同竞争策略下的选择。对使用者来说,开源模型意味着更多的选择和更低的成本——这一点值得持续关注。
几个观察
1产业集中度已经相当高。相较于前几年"百模大战"的盛况,现在主流玩家的格局已经基本成型,新进入者的窗口在收窄。
2模型能力从 2025 年中开始明显加速。主流厂商呈现出明显的正向飞轮效应——模型越好、用户越多、数据反馈越好、模型更好。目前各家声称的终极追求都还是 AGI。
32025-2026 年有一个很明显的战略转向:去 C 端化、重 B 端化。多数头部企业在收缩泛娱乐类 C 端投入,核心资源转向企业服务、生产力工具与 MaaS。这个趋势在国内外均表现显著。
4算力瓶颈依然是最大的制约。也就是"5 层蛋糕"的底下三层。这三层未来市场机会非常大,但也是所有模型厂商的共同瓶颈。未来可以重点关注电力市场的动态以及CUDA霸权的变化。
以上内容为个人学习笔记和观察,非专业行业分析
数据来源为各公司公开信息和主流科技媒体报道,如有错误欢迎指正

夜雨聆风