AI 产业图景:5 层蛋糕与主要玩家

AI 产业观察 · 系列第一篇

AI 产业图景：5 层蛋糕与主要玩家

这是一个系列分享的第一篇。我尝试把自己近期跟踪 AI 产业的个人观察整理出来，作为学习笔记。如有不妥，欢迎指正。

为什么要了解产业全景

目前 AI 产业发展太快了。快到什么程度？我前几天写的那篇 OpenClaw 记忆架构文章，里面不少内容现在已经过时了。

如果只记住"某个工具怎么用"，这些经验很可能几周后就不适用了。但如果你对整个产业有一个大致的图景——知道有哪些玩家、它们各自在做什么、能力边界和发展方向是什么——当新东西出来的时候，你能很快判断它是什么位置、值不值得关注。

"5 层蛋糕"：AI 产业的基本结构

整个 AI 产业可以想象成一个 5 层蛋糕（黄仁勋的比喻）。从底往上大致是：

5应用层基于模型做出的各种产品和工具

4模型层各家大模型，"大脑"本身

3基础设施（土地/供电/冷却系统/建筑工程/网络通信）

2芯片（Nvida/AMD/Google/AWS...）

1能源（电力）

对我们来说，底下三层不用特别关心——那是芯片厂和云服务商的事情。但有一点值得知道：影响模型能力和厂商服务能力的最大瓶颈就是算力，也就是底下那三层。这也是为什么"算力"这个词这两年出现频率这么高。

我们重点关注的是模型层和应用层——这两层直接决定了我们能用到什么工具、工具有多强。

国内模型厂商

性价比高，竞争激烈

第一梯队："御三家"

国内目前有三家被业内称为"御三家"的独立模型公司，都在过去一年多密集上市和发布新模型。

MiniMax（稀宇科技）

估值港股上市（00100.HK），市值约 2695 亿港元，2026.1.9 上市

主打模型 MiniMax M2.7（2026.3 发布，已开源），海螺系多模态模型

模型特点

自我进化能力，能自主构建 Agent Harness 优化训练流程；
200K 上下文 + Agent 多智能体协作；
软件工程能力接近顶级，价格仅 1/20；
全模态支持（文本/图像/音频/视频/音乐）

主要产品 星野 / Talkie（C 端情感陪聊）、MiniMax 开放平台、Token Plan 订阅、Maxclaw（Agent 工具）

月之暗面（Moonshot）

估值未上市，最新估值约 180 亿美元（2026.3 融资），3 个月内翻 4 倍

主打模型 Kimi K2.5（2026.1 发布，已开源）、Kimi K2

模型特点

原生多模态架构（Native Multimodal）；
原生视觉能力，直接分析复杂图像布局；
Agent Swarm 智能体集群，调度 100 个 AI 分身并行任务
较早对金融和资本市场场景进行了落地实践

主要产品 Kimi AI 助手（C 端）、Kimi API 平台（企业级）、智能体蜂群开发工具、Kimiclaw（Agent）

智谱 AI（Z.ai，清华系）

估值港股上市（02513.HK），市值约 3972 亿港元，2026.1.8 上市

主打模型 GLM-5.1（2026.4.8 发布，已开源），与 GLM-5、GLM-5-Turbo 构成旗舰推理矩阵

模型特点

代码高手，从"分钟级交互"推进到 8 小时长程任务；
202K 上下文 + 164K 最大输出；
代码能力逼近 Opus 4.6，SWE-benchPro 基准优秀；
主打"超长文本 + 高阶推理 + 强代码"

主要产品 ChatGLM / 智谱清言（C 端）、GLM Coding Plan（开发者订阅）、智谱开放平台（企业级）、Autoclaw 澳龙（Agent）

两个不能忽视的重量级玩家

DeepSeek（深度求索）

估值超 100 亿美元（首次对外融资，计划募资至少 3 亿美元）

主打模型 DeepSeek-V3.2（当前主力）；DeepSeek-V4（待发布，万众期待）

模型特点 效率高、成本低，开源先行者。V4 据传完全基于华为芯片开发——如果属实将证明国产算力链的可行性

主要产品 DeepSeek 网站和 App、开放平台 API、政企 B 端合作

阶跃星辰（Stepfun）

估值 Pre-IPO 轮投前估值 50-60 亿美元（2026.4 交割），计划年内港股上市，目标约 100 亿美元

主打模型 StepMind 系列（Step-3.5 Flash、Step-R-mini 等），6 款多模态基座模型

模型特点 原生多模态技术壁垒，覆盖语言/图像/音频/视频全场景；推理效率极高，Token 消耗低；性价比高

主要产品 冒泡鸭（AI 互动平台）、AI 小财神（金融智能体）、Stepfun 开放平台

国内大厂：模型 + 生态的组合战

国内互联网大厂的打法和独立模型公司不同——它们有既有生态可以嫁接，走的是"模型 + 平台 + 分发渠道"三位一体的路线。

腾讯

基座是混元大模型系列，图像和视频模型深度嵌入游戏业务。

C 端结合社交生态推广元宝、IMA Copilot 和 Claw 类 Agent 产品；

B 端结合腾讯云和企微生态，Token 出售和 Agent 托管等业务发展迅猛。

对我们来说，腾讯内部提供的 AI 工具（如 WorkBuddy、qclaw 等）都是基于这条线。

阿里

Qwen3 系列（最新 Qwen3.6-plus）稳居国产第一梯队，开源战略在国内最为激进，在国际 AI 产业影响力大。

依托阿里云和钉钉，Token 出售和 Agent 部署优化等业务发展迅猛。

C 端产品重点是千问 App。

字节

Seed2.0 模型能力稳居国产第一梯队，是 C 端豆包、抖音和其他字节系产品的模型基座。

视频模型 Seedance 2.0 暂居世界第一，正在重构短剧和漫剧生态。

依托飞书和火山云，B 端 Token 出售和 Agent 部署优化业务增长很快。

一句话总结国内格局：国内模型厂商的特点是优秀的模型能力和更优秀的性价比，在全球 Token 消费中总量占比很高。但在 Agent 领域，国内模型厂商目前主要扮演上游供应商和本土场景落地者角色——真正定义通用 Agent 产品形态的力量，目前更多在海外。

美国模型厂商

第一梯队与追赶者

三家核心玩家

Google DeepMind

市值隶属 Alphabet 集团，AI 业务独立核算，企业价值约 3400 亿美元

主打模型 Gemini 3.1 系列（Ultra / Pro / Flash / Deep Think，2026.2 发布）；图像模型 Nano Banana 2 业界顶级

模型特点

多模态与长上下文是核心竞争力；
视频模型国际第一梯队；Gemini 3.1 Pro 推理能力翻倍；
AI 行业元老，在科研场景已有大量成果。

开源线Gemma 4（2026.4.2 发布），基于 Gemini 3 技术，Apache 2.0 完全开源。4 个版本（2B–31B），128K–256K 上下文，140+ 语言，原生多模态。31B 版本消费级 GPU（RTX 3090）可运行，自建年成本约 GPT-5.2 API 的 15%。业内评价"开源天花板"

主要产品 Gemini + Workspace 深度整合、NoteLLM、Google AI Studio、Google Antigravity + Gemini CLI

OpenAI

估值未上市，最新估值约 8520 亿美元（2026.3.31 完成 1220 亿美元融资），全球估值最高的创业企业

主打模型 GPT-5 系列（2025.8 发布），主打 GPT-5.4；内测图像模型 GPT-image-2 据传将超越 Nano Banana

模型特点

业界顶级，超强推理和超低幻觉，代码能力超强。
推理有时过度，表述偏啰嗦，AI 味比较重，大局观和规划能力不如 Opus

主要产品 ChatGPT（月活全球最高）、OpenAI API（企业级）、Codex（主力 Agent 产品）

Anthropic（A 社）

AI 界目前最像 Apple 的玩家

估值 G 轮融资后估值 3800 亿美元，4 月获 8000 亿美元要约（未接受）；IPO 或最早 2026.10 启动

主打模型 Claude Mythos preview（Project Glasswing 封闭测试中）；Opus 4.7（4 月）/ Opus 4.6（2 月）/ Sonnet 4.6 / Haiku 4.6 等多层级

模型特点行业定义者；代码、Agent 智能体、工程能力和企业工作流方面全球领先。个人体验中综合能力最强

主要产品 Claude.ai（C 端工作站）、Claude API（企业级）、

Claude Code——最强工程 Agent，没有之一

新产品 Claude Design 将颠覆设计行业

两个值得关注的追赶者

xAI

估值约 500 亿美元（2026.1 完成 200 亿美元 Series E，超额募资）。马斯克创办

主打模型 Grok 4.20（2026.3.19 发布），约 3 万亿参数 MoE 架构

模型特点 四 Agent 多代理协作架构（Grok / Harper / Benjamin / Lucas 四子 Agent 分工）；原生 tool calling；幻觉率号称业界最低；API 降价 60%

独特优势 背靠 X 平台数据 + Colossus 超算集群 + Tesla 生态。马斯克宇宙的算力资源是最大壁垒

潜在风险 但 xAI 正经历剧烈的组织动荡——2026 年 2-3 月间，12 位创始团队成员相继离职（除马斯克外几乎全部出走），包括联合创始人吴宇怀（辛顿学生）、诺迪恩等核心研究力量。短期内对模型迭代节奏和工程稳定性的影响仍有待观察

几个观察

1产业集中度已经相当高。相较于前几年"百模大战"的盛况，现在主流玩家的格局已经基本成型，新进入者的窗口在收窄。

2模型能力从 2025 年中开始明显加速。主流厂商呈现出明显的正向飞轮效应——模型越好、用户越多、数据反馈越好、模型更好。目前各家声称的终极追求都还是 AGI。

32025-2026 年有一个很明显的战略转向：去 C 端化、重 B 端化。多数头部企业在收缩泛娱乐类 C 端投入，核心资源转向企业服务、生产力工具与 MaaS。这个趋势在国内外均表现显著。

4算力瓶颈依然是最大的制约。也就是"5 层蛋糕"的底下三层。这三层未来市场机会非常大，但也是所有模型厂商的共同瓶颈。未来可以重点关注电力市场的动态以及CUDA霸权的变化。

以上内容为个人学习笔记和观察，非专业行业分析

数据来源为各公司公开信息和主流科技媒体报道，如有错误欢迎指正