AI硬件投资的第一性原理

Token爆发不是神话，但它也不是提款机

投资AI的第一性原理是Token消耗量几乎是每隔几个月都翻倍，这催生了AI硬件需求的指数级增长。

而且AI硬件对性能要求有极致和严苛的要求，往往需要经过海外CSP的繁琐认证，这导致AI硬件产业的竞争格局良好，因为高技术和高顾客门槛，难以内卷。需求指数级增加，供给有限，硬件产业核心公司的ESP大爆发！

斜率极其陡峭，其他行业黯然失色！旭创的业绩爆发就是证明！

一、Token爆发是真实的

AI需求已经不是线性增长，而是非线性扩张

我们这次讨论的起点，是一个很强的投资命题：AI的第一性原理，是Token消耗量几乎每隔几个月翻倍，由此催生AI硬件需求的指数级增长。这个判断最有价值的地方在于，它没有从“概念热度”出发，而是试图从AI使用量的底层计量单位出发。Token不是股吧情绪，不是产业故事，也不是券商标题。Token是模型实际处理的信息单位，是AI被调用、被使用、被消耗的直接痕迹。

从公开数据看，Token爆发并不是虚构。

Google CEO Sundar Pichai在2026年I/O公开披露，Google旗下AI产品和API月处理Token量，已经从2024年的约9.7万亿，增长到2025年的约480万亿，再增长到2026年的超过3.2千万亿。按这个口径测算，2024到2025年约增长49倍，相当于约每2.1个月翻倍；2025到2026年约增长6.7倍，相当于约每4.4个月翻倍；两年累计约330倍，相当于平均约每2.9个月翻倍。

这个量级足以说明，AI使用量不是正常互联网产品的稳态增长，而是处在典型的非线性扩张阶段。Google也明确把Token称为理解AI采用规模的一个重要代理指标。

这就是AI硬件投资逻辑的第一块地基：需求侧不是温和复苏，而是使用量爆炸。

它和传统硬件周期最大的区别在于，传统电子硬件很多时候由换机周期、库存周期、消费景气决定；而AI硬件的底层需求来自模型训练、模型推理、智能体调用、企业API、搜索重构、代码生成、多模态生成、视频生成、办公自动化、广告系统、推荐系统、机器人系统等多重场景叠加。只要AI能力继续提升，使用门槛继续下降，应用场景继续扩散，Token消耗就会继续放大。

但这里必须冷静：Token是非常重要的需求信号，但它不是最终利润。

它说明AI使用量在爆发，说明计算需求在扩张，说明AI基础设施有长期投资必要；但它不能直接推出“所有AI硬件公司都会赚钱”，更不能推出“任何带AI硬件概念的股票都应该上涨”。Token是第一层证据，不是最后一层结论。把Token爆发理解成“硬件收入必然同比例增长”，是把需求指标误读成利润指标；把Token爆发理解成“所有硬件环节都能获得高估值”，则是把产业景气误读成公司竞争力。

AI硬件投资时：不能把Token增长、CSP资本开支、认证门槛、供应短缺、公司盈利、投资风险全部混在一个画面里。

真正有效的分析，必须把它们拆开。

第一层看需求是否真实；

第二层看需求如何传导；

第三层看资本开支是否落地；

第四层看高端硬件壁垒；

第五层看利润流向；

第六层看风险和估值。

否则，最后得到的不是研究，而是口号。

所以，这篇文章的第一个结论是：AI硬件投资的起点，确实可以从Token爆发开始；但严谨的投资分析，不能停在Token爆发。Token证明的是需求强度，不证明利润归属。

二、Token增长不等于硬件需求同比增长

中间还有效率、模型结构和单位成本

如果只看Token增长，很容易得到一个过度乐观的结论：Token两年增长约330倍，那么AI硬件需求也会爆炸式增长，相关公司自然迎来ESP、ASP、利润率全面上行。这个推理方向有道理，但中间缺少一个关键变量：效率提升。

更严谨的表达应该是：AI硬件需求，大致取决于Token总量、单Token计算强度、访存强度、网络通信强度、并发要求、低时延要求，再除以硬件效率、算法效率、模型压缩效率和系统利用率。换句话说，Token增长会拉动硬件需求，但硬件需求不会机械地按Token同比例增长。

因为在AI产业中，需求在爆炸，效率也在爆炸。

Stanford HAI《2025 AI Index Report》指出，达到GPT-3.5级别能力的系统，其推理成本在2022年11月至2024年10月之间下降超过280倍；硬件层面，成本每年下降约30%，能效每年提升约40%；开源权重模型与闭源模型在部分基准上的差距也快速收敛。这些事实说明，AI不是一个简单的“用量越多、硬件越多”的线性系统，而是一个同时发生需求爆炸和效率爆炸的动态系统。

这意味着，投资AI硬件不能只问“Token涨了多少”，还必须问四个问题。

第一，Token增长来自什么场景？

如果增长主要来自轻量问答、摘要、低复杂度聊天，那么单Token计算强度可能较低；如果增长来自长上下文、代码生成、复杂推理、多模态视频、智能体多步调用，那么单Token的计算、显存、网络、存储压力都会显著提高。后者对硬件的拉动远强于前者。

第二，增长发生在训练端还是推理端？

训练端更强调大规模GPU/TPU集群、HBM、互连、网络、供电、液冷、先进封装；推理端更强调成本、延迟、吞吐、并发、显存利用率和部署密度。随着AI应用落地，推理Token占比会快速提高，但推理硬件的竞争也更容易从“性能极限”转向“性价比极限”。

第三，模型结构是否改变？

MoE架构、量化、蒸馏、小模型、KV Cache优化、投机解码、专用推理芯片，都会改变单位Token所需硬件资源。效率提升不是AI硬件的敌人，因为成本下降会释放更多需求；但效率提升会改变利润分配，迫使硬件公司不断升级，否则就会被成本曲线吞噬。

第四，硬件利用率是否提高？

同样的Token量，如果通过更好的调度、更高的集群利用率、更优的软件栈、更成熟的编译器和通信库实现，就不一定需要同比例新增硬件。这也是为什么AI硬件真正的壁垒不仅在芯片本身，还在软硬件协同、系统架构、网络拓扑、集群调度和生态绑定。

因此，Token增长对硬件需求的传导不是简单乘法，而是一个竞争中的动态平衡：需求爆发向上拉，效率提升向下压；只有当需求增长强度持续超过效率提升速度，硬件需求才会继续扩张。

当前阶段，从CSP资本开支、GPU收入、数据中心建设、HBM紧缺、先进封装扩产、高速互连需求看，需求侧仍然明显强于效率抵消。但这并不意味着未来所有环节都能持续享受暴利。

这里要特别警惕一种错误：把“效率提升”理解成AI硬件利空。事实上，短期未必如此。推理成本下降，反而可能像通信行业的带宽降价一样，释放更大的使用量。单位成本下降以后，原来不经济的AI应用会变得经济，原来不愿意频繁调用模型的业务会开始大规模调用。成本下降不是需求消失，而是需求弹性释放。但是，最终受益的是那些能不断降低单位Token成本、同时仍保有技术壁垒和客户绑定的公司，而不是所有硬件供应商。

第二个结论是：Token爆发是AI硬件需求的上游驱动力，但硬件需求的真实增幅，取决于Token增长与效率提升之间的赛跑。投资不能只看需求增速，还要看单位成本曲线和技术替代路径。

三、CSP资本开支是硬证据

AI不是故事，而是正在吞噬资产负债表

如果说Token数据证明了AI使用量爆发，那么CSP资本开支证明了另一件事：AI需求已经从软件调用，转化成了真金白银的基础设施投资。

这一步非常重要。

资本市场可以讲故事，但资本开支很难长期伪装。尤其是Alphabet、Meta、Amazon这类巨头，它们的CapEx不是几页PPT，而是真实的数据中心、服务器、GPU/TPU、网络、供电、液冷、土地、电力合同和长期折旧。

Alphabet在2026年I/O相关公开信息中提到，公司2022年资本开支约310亿美元，而2026年预计达到约1800亿至1900亿美元，约为2022年的六倍。

Alphabet在2026年一季度业绩电话会中也披露，将全年CapEx指引上调至1800亿至1900亿美元，并称其看到“前所未有的内部和外部AI算力需求”。这说明，AI基础设施投资已经不是边际试验，而是大型科技公司资产配置的核心方向。

Meta同样给出了强烈信号。

Meta在2026年一季报中披露，公司预计2026年资本开支，包括融资租赁本金支付，将达到1250亿至1450亿美元，高于此前1150亿至1350亿美元的区间。公司解释称，这反映了更高的组件价格，以及为支持未来年度容量而增加的数据中心成本。这里的关键词不是“AI概念”，而是“组件价格”和“数据中心容量”。这意味着硬件供给、上游价格、数据中心建设已经对公司资本计划形成实质影响。

Amazon的数据更直接。

Amazon 2026年一季报披露，过去12个月自由现金流下降到12亿美元，主要因为物业和设备采购同比增加593亿美元，而这一增加主要反映AI投资。Amazon还披露，AWS一季度收入同比增长28%至376亿美元，其芯片业务年化收入运行率超过200亿美元，且同比三位数增长。这说明AI基础设施投资不仅消耗现金流，也在云业务、自研芯片和加速计算服务中形成收入闭环。

CSP资本开支之所以重要，是因为它是AI硬件产业链最强的需求锚。AI硬件需求不是来自散户想象，而是来自全球最有现金流、最懂算力经济账、最强工程能力的客户群体。这些客户不会因为市场情绪好就随便下单，也不会因为某个概念热就盲目扩产。它们提高CapEx，是因为内部搜索、广告、云计算、办公、代码、视频、推荐、智能体、企业API都在吞吐AI算力；外部客户也在向云端购买AI训练和推理能力。

但资本开支也不是没有风险。

相反，CapEx越高，未来验证压力越大。对于CSP来说，AI基础设施投资最终必须通过云收入、广告效率、订阅收入、企业服务、生产率提升、用户时长、防御搜索入口被替代等方式获得回报。对于硬件供应商来说，CSP大规模CapEx意味着订单机会，但也意味着客户集中度高、议价能力强、技术路线被客户定义、交付节奏被客户约束。换句话说，CSP既是AI硬件公司的上帝，也是AI硬件公司的压力源。

资本开支还有一个更冷峻的含义：AI正在使科技巨头从“轻资产软件公司”部分转向“重资产基础设施公司”。

这会改变整个产业的估值结构。

过去互联网平台的核心优势是高毛利、低边际成本、强网络效应；AI时代，算力、数据中心、电力、先进封装、HBM、网络、液冷、折旧会持续进入利润表和现金流量表。软件公司仍然强大，但不再那么轻。硬件公司获得机会，但也必须面对客户压价、周期波动和技术迭代。

第三个结论是：CSP资本开支证明AI硬件需求已经进入现实投资阶段。真正值得跟踪的，不是新闻标题，而是CapEx指引、数据中心建设、组件价格、云收入、订单可见度和客户库存周期。

四、高端AI硬件不是普通制造

真正的壁垒来自系统级工程和客户认证

另一个关键判断，是AI硬件对性能有极致和严苛要求，往往需要经过海外CSP繁琐认证，因此产业竞争格局良好，难以内卷。

这个判断大方向成立，但要加一个限定：它只适用于真正进入CSP主系统、承担关键性能或可靠性职责的高端环节。

Google Cloud在关于AI数据中心架构的文章中明确指出，AI需求变化动态且剧烈，造成供需错配；每一代AI硬件，如TPU和GPU，都会带来新的功能，同时也带来新的功耗、机架、网络和冷却要求；形态、板级密度、网络拓扑、电源架构、液冷方案等变化叠加，会使系统设计、部署和维护复杂度呈组合式上升。Google Cloud还强调，未来数据中心要在电力交付、冷却、服务器大厅设计、计算、存储和网络等所有组件上整体协同。

这段话背后的产业含义非常清楚：高端AI硬件不是孤立零件，而是系统级工程品。

GPU不是简单插在主板上的计算卡，HBM不是普通存储，光模块不是普通通信器件，PCB/CCL不是普通线路板，电源和液冷也不是普通配套件。它们共同服务于一个目标：在极高功耗、极高带宽、极低延迟、极高可靠性、极高密度的条件下，让一个庞大集群稳定运行。

这就解释了为什么高端AI硬件容易形成壁垒。

第一是性能壁垒。AI训练和推理集群对带宽、延迟、误码率、功耗、散热、材料损耗、信号完整性都有极高要求。低一档产品不是便宜替代，而可能直接影响集群效率和稳定性。

第二是可靠性壁垒。数据中心不是消费电子，不能频繁宕机、返修和调试；一旦出现稳定性问题，损失不是单个产品价格，而是整个集群的算力损失和服务风险。

第三是认证壁垒。CSP导入供应商通常要经过样品测试、小批验证、系统联调、可靠性验证、量产爬坡和持续监控。这个过程天然排斥“低价快速替代”。

第四是协同壁垒。越靠近主系统，越需要和客户研发、架构、供应链、制造、测试团队深度协同；这种关系不是靠价格战短期打进去的。

但这并不意味着AI硬件所有环节都不会内卷。

真正难以内卷的是高性能、高可靠、高认证、高协同、高迭代的环节。

相反，凡是标准化程度高、技术差异小、认证周期短、产能可快速复制、客户转换成本低的环节，都可能在景气高点之后进入价格竞争。

A股投资尤其容易犯这个错误：看到“AI服务器”“数据中心”“液冷”“高速PCB”“光模块”等词，就默认所有相关公司都享受同样壁垒。事实不是这样。越底层、越关键、越不可替代，壁垒越强；越外围、越通用、越容易扩产，壁垒越弱。

还要注意，壁垒不是静态的。

今天的高壁垒环节，明天可能因为标准化、国产替代、客户多供应商策略、专用ASIC替代、技术成熟而下降。客户认证形成护城河，但客户也不希望供应商获得过强定价权。CSP会通过多供应商体系、自研芯片、架构重构、标准接口、供应链扶持来削弱单一供应商垄断。这就是为什么高端硬件公司的利润率既可能很高，也不可能永远不受约束。

第四个结论是：AI硬件的壁垒来自系统级工程，而不是来自“硬件”两个字。真正的竞争力不是会不会生产，而是能不能通过CSP认证、能不能稳定交付、能不能跟上代际升级、能不能嵌入客户系统。

五、真正受益的是“短缺、认证、迭代”同时成立的环节

而不是所有硬件

AI硬件产业链很长，从GPU/AI ASIC、HBM、先进封装、高速互连、服务器、PCB/CCL、光模块、交换机、OCS、电源、液冷、测试设备，到机柜、线缆、连接器、结构件、散热材料，都可以被纳入广义AI硬件。

问题在于，资本市场不能买“产业链”，只能买公司。公司能否受益，取决于它所在环节是否具备三个条件：短缺、认证、迭代。

所谓短缺，是需求增长快于供给扩张。

没有短缺，就没有价格弹性；没有价格弹性，收入增长可能只是产能扩张，毛利率未必提升。所谓认证，是客户切换成本高。没有认证壁垒，就很容易出现新进入者用低价抢份额。所谓迭代，是技术持续升级。没有迭代，短缺迟早被扩产消灭；有迭代，领先公司可以通过新品周期维持ASP和利润率。

NVIDIA是这个逻辑的典型样本。

NVIDIA披露，2026财年第四季度数据中心收入达到623亿美元，同比增75%；2026财年全年收入2159亿美元，同比增65%；全年数据中心收入1937亿美元，同比增68%；第四季度GAAP毛利率达到75.0%。这组数据说明，在AI算力核心环节，只要需求强、生态强、供给紧、产品代际领先，硬件公司完全可以获得惊人的收入规模和利润率。

但NVIDIA不是“所有硬件公司”的代表，而是“极端强势硬件平台公司”的代表。它的优势不只是芯片性能，还包括CUDA生态、NVLink/NVSwitch、网络、软件栈、开发者生态、客户绑定、代际路线图、供应链控制和规模效应。换句话说，NVIDIA的高利润不是因为它属于硬件行业，而是因为它在AI硬件价值链中占据了最核心的利润分配位置。

沿着这个逻辑看，AI硬件投资应该分层。

第一层是算力核心，包括GPU、AI ASIC、TPU、训练和推理加速器。这一层决定集群能力，是价值量最高的部分。

第二层是存储和封装，包括HBM、先进封装、Chiplet互连、硅中介层或新型封装基板。这一层决定高带宽和高集成，是性能瓶颈所在。

第三层是高速互连，包括交换芯片、光模块、光引擎、SerDes、DSP、连接器、线缆和网络架构。这一层决定集群扩展效率。

第四层是承载和材料，包括高端PCB、低损耗CCL、高频高速材料、铜箔、载板等。

第五层是能源和热管理，包括电源、供电架构、液冷、热管理、机柜。

第六层是测试和制造设备，包括高速示波器、光模块测试、封装设备、PCB设备等。

每一层都有机会，但机会质量不同。最好的环节不是“空间最大”的环节，而是“空间大、壁垒高、供给慢、认证深、产品升级快”的环节。

比如高速光模块在AI集群中价值量持续提升，但不同公司之间差异很大：有的掌握核心客户和高速产品平台，有的只是跟随产能；有的能进入海外CSP主链，有的只在二线市场竞争。比如PCB/CCL受益于高速、高频、高层数、低损耗趋势，但普通PCB产能并不天然稀缺，真正稀缺的是高端材料体系、良率控制、客户认证和大批量交付能力。比如液冷需求确定，但如果某些部件标准化过快，就可能从高景气赛道变成低毛利制造。

所以，投资AI硬件不能只问“这个环节有没有需求”。还要问：它是否短缺？短缺是技术短缺，还是临时产能短缺？它是否经过CSP认证？认证是样品级，还是量产级？它是否有代际升级？升级是否提升ASP？公司是否有定价权？客户是否集中？毛利率是否能守住？扩产后供需是否逆转？这些问题比“是不是AI硬件”重要得多。

第五个结论是：AI硬件的超额收益不属于所有参与者，而属于那些处在关键瓶颈、通过核心客户认证、能跟上技术代际升级、并且在利润分配中拥有议价权的公司。

六、最大的风险

最大的风险：行业很热，不等于公司都赚钱；公司赚钱，不等于股票还有超额收益。

最后必须把话说冷一点。AI硬件是强产业趋势，但强产业趋势并不自动等于强投资收益。历史上很多大产业周期都证明过这一点：景气是真的，需求是真的，订单也是真的，但最后并不是所有公司都赚钱，更不是所有股票都让投资者赚钱。

原因很简单：产业逻辑、公司逻辑、股价逻辑是三回事。

第一重风险，是客户集中和议价压力。

CSP是AI硬件最大的需求来源，但也是最强势的买方。它们资金雄厚、技术能力强、供应链管理能力强，有动力扶持多供应商，有能力推动标准化，有资源自研芯片和系统。Amazon披露其芯片业务年化收入运行率已经超过200亿美元，并且同比三位数增长；这说明CSP不是被动购买硬件，而是在主动重构硬件供给格局。

第二重风险，是效率提升改变需求结构。

Stanford的数据已经说明，推理成本在快速下降，硬件成本和能效也在持续改善。效率提升短期可能释放需求，但长期会筛掉落后产能。那些只靠行业β、没有技术迭代能力的公司，可能在景气早期被需求带起来，在景气中后期被降本压力打回原形。

第三重风险，是ASIC和自研方案替代GPU或通用硬件。

GPU仍然是当前AI训练和通用推理的核心，但CSP对成本、能效、供应安全的诉求，会不断推动自研ASIC、TPU、Trainium、定制加速器和专用推理方案发展。替代不是一夜之间发生，也不会简单消灭GPU，但它会改变增量订单的结构，改变利润池的分布。

第四重风险，是供应短缺变成供应过剩。

任何高景气行业都会吸引扩产。短缺阶段，市场看的是产能；扩产后，市场看的是价格；价格回落后，市场看的是成本；成本竞争后，市场看的是资产负债表。AI硬件某些环节今天短缺，不等于三年后仍短缺。投资者必须区分“长期结构性短缺”和“短期产能错配”。

第五重风险，是估值提前透支。

资本市场不是等基本面兑现以后才反应，它往往提前定价。很多AI硬件公司在订单、业绩、毛利率还没有完全兑现时，股价已经反映了乐观预期。此时即便行业继续增长，公司继续盈利，股价也可能因为预期过高而不涨，甚至下跌。投资不是判断行业好不好，而是判断当下价格是否已经充分甚至过度反映未来。

因此，我们这次讨论最后应该落到一个更锋利、更可执行的框架：AI硬件投资不能只看“Token爆发”，而要看六个条件是否同时成立。

第一，需求是否真实，而不是概念驱动。Token、API调用、云收入、CapEx、订单、客户验证都要相互印证。第二，传导是否清晰。Token增长必须能穿透效率提升，转化为具体硬件需求。第三，供给是否受限。技术、良率、产能、认证、材料、设备是否真的构成瓶颈。第四，客户是否高质量。是否进入海外CSP或国内头部AI基础设施主链，而不是停留在低端替代。第五，盈利是否可持续。收入增长是否伴随ASP、毛利率、现金流和ROIC改善。第六，估值是否仍有空间。好公司如果已经按完美剧本定价，也可能不是好交易。

这就是我对你最初观点的最终修正：AI硬件投资的第一性原理，不是简单的“Token每几个月翻倍，所以硬件公司ESP大爆发”；而是“有效智能需求扩张，超过效率提升的抵消，并通过CSP资本开支转化为高端硬件订单；在供给受限、认证严格、代际升级持续的关键环节，少数公司获得收入和利润弹性”。

这句话比原命题更冷，也更接近真实世界。它保留了AI硬件大周期的核心机会，也排除了过度乐观的误判。AI硬件不是不能投，恰恰相反，它可能仍然是未来几年全球科技产业最重要的资本开支方向之一。但投资者真正要避免的，是把产业趋势当作个股护身符，把需求爆发当作利润保证，把客户认证当作永恒壁垒，把短期短缺当作长期垄断。

最终结论可以压缩成一句话：AI硬件的机会是真的，但它不是平均分配的；Token爆发是起点，供给瓶颈是放大器，客户认证是护城河，技术迭代是生命线，而估值和利润分配决定最终投资结果。