豆包的“深度研究”,仅供参考。非预判,而是理解。
一、军备竞赛期概览:40%+高速增长的黄金时代
1.1 时间界定与阶段特征
AI基建军备竞赛期被明确定义为2025-2027年这三年,其核心特征是高速增长(40%+),这一判断基于IDC、Gartner等权威机构的一致预测口径。根据IDC最新发布的《全球人工智能基础设施季度跟踪报告》,2025年第二季度全球AI计算与存储硬件基础设施支出同比激增166%,达到820亿美元,连续多年保持高双位数增长态势。
这一阶段的本质是大模型训练为主导的算力军备竞赛,芯片紧缺成为常态,资本开支呈现暴增态势。从2025年全年数据看,全球AI基础设施支出达到318亿美元,较2024年的153亿美元实现翻倍增长(107.6%)。Gartner的数据更为乐观,预测2025年全球AI总支出将达到1.48万亿美元,同比增长50%。
军备竞赛期与后续阶段存在明确的时间节点划分:2027-2028年将进入推理爆发期,推理算力超越训练成为主导,增速放缓至25%-35%;2028-2030年进入成熟优化期,以普惠AI、能效优先为特征,增速进一步降至15%-25%。
1.2 全球与中国增速对比验证
全球AI基建投资在军备竞赛期呈现超预期的爆发式增长。根据Gartner最新数据,2025年全球AI支出达到1.48万亿美元(同比+50%),2026年预计达到2.52万亿美元(同比+70%),2027年将突破3.34万亿美元(同比+33%),在高基数上依旧保持高速增长。
中国在全球AI基建投资中占据重要地位,且增速显著高于全球平均水平。2025年中国云厂商AI算力专项投入突破4500亿元人民币。根据多方预测,2027年中国有望突破1万亿美元投资规模,互联网巨头AI基础设施投资合计达840亿美元,增速维持23%-28%高位,未来五年中国AI投资复合增速(23%-28%)高于美国的18%-22%。
从全球AI基础设施支出的地域分布看,2025年第四季度美国占据77%的份额(692亿美元,同比增长81.5%),中国占9.4%(84亿美元,同比下降8.1%),但中国仍是全球第二大市场。值得注意的是,中国市场受出口管制影响出现短期下滑,但长期增长潜力依然巨大。
1.3 40%+增速的构成与来源分析
军备竞赛期40%+的高速增长主要由以下几个核心驱动因素构成:
云厂商资本开支的爆发式增长是最直接的驱动力。2025年五大超大规模云服务商(AWS、微软、谷歌、Meta、Oracle)资本开支约3810亿美元(同比+68%),2025-2027年合计约1.4万亿美元。其中,AWS 2026年资本开支计划达到2000亿美元,较2025年的1310亿美元增长52.7%;谷歌2026年资本开支指引为1750-1850亿美元,较2025年的914亿美元近乎翻倍;Meta 2026年资本开支攀升至1350亿美元。
大模型训练需求的指数级增长是根本性驱动力。根据行业分析,2025年随着GPT-5(十万亿级参数)、Claude 3(万亿级参数)等模型的训练,训练算力需求将较2024年增长5-8倍。大模型参数规模从2023年的千亿级快速突破至万亿级,2025年国内头部企业推出的行业大模型参数规模突破5万亿。
AI服务器出货量的翻倍增长直接体现了硬件需求的旺盛。2025年全球AI服务器出货量达到300万台,同比增长100%;中国AI服务器出货量达到48.8万台,同比增长超过40%。工业富联作为全球AI服务器代工龙头,2025年第一季度AI服务器出货量同比增长213%。
供应链瓶颈推高的投资需求也贡献了部分增长。由于GPU、HBM内存等核心组件严重短缺,企业不得不加大投资以确保供应链安全。例如,HBM内存的产能已被锁至2028年,供需缺口超过50%;台积电3nm制程产能利用率超过120%,订单排期已至2027年上半年。
二、军备竞赛期核心驱动因素深度剖析
2.1 大模型训练需求爆发
大模型训练需求在军备竞赛期呈现前所未有的爆发式增长,这一趋势的核心驱动力来自于模型规模的指数级扩张和应用场景的快速拓展。
模型参数规模的跨越式增长是最直观的体现。从GPT-3(2020年,1750亿参数)到GPT-4(2023年,万亿级参数)再到GPT-5(2025年预期,十万亿级参数),大模型参数规模每12-18个月翻一番。2025年,主流语言模型参数规模平均提升至超过1.5万亿,训练数据量增长近3倍。中国企业在这一轮竞赛中表现尤为突出,阿里通义发布的Qwen3-Max总参数超过1万亿,预训练数据量达36万亿词元;蚂蚁集团开源全球首个万亿参数推理大模型Ring-1T-preview;上海AI实验室的Intern-S1-Pro基于MoE架构拥有2410亿总参数。
训练算力需求的指数级增长带来了巨大的基础设施投资需求。根据行业测算,训练GPT-4需要约1万块A100显卡持续工作11个月,或约10万张A100卡历时90-100天完成,总算力需求达到2.15×10^25 FLOPs。千亿参数模型训练约需3-4 ZettaFLOPs,而训练一次GPT-4需要约5000万度电。
多模态模型的兴起进一步推高了算力需求。更复杂的多模态模型(如OpenAI的GPT-5)对算力的需求呈指数级增长,仅视频生成模块的训练就需要超过5000块A100芯片连续运行90天。2025年间,生成式AI、多模态大模型技术持续突破,应用场景从通用领域渗透至智能制造、智慧医疗、自动驾驶、金融科技等垂直行业,形成万亿级市场规模。
训练成本的急剧攀升反映了算力需求的旺盛程度。据测算,训练Llama 4的成本预计花费数亿美元,而2020年训练GPT-3的成本约为450万美元,五年间训练成本增长数十倍。这种成本增长不仅体现在硬件采购上,还包括电力消耗、数据中心建设、人才成本等多个方面。
2.2 云厂商资本开支计划与执行
全球主要云厂商在军备竞赛期制定并执行了史无前例的激进资本开支计划,这些计划的规模和执行力度远超市场预期。
北美四大云巨头的投资规模达到了惊人的水平。根据最新数据,2025年四大云厂商(微软、亚马逊、谷歌、Meta)资本开支合计约4060亿美元,同比增长78%,较2024年的2280亿美元(同比增长55%)实现了大幅跃升。2026年,这四家巨头合计的AI资本支出预计达到6100亿至6600亿美元。
亚马逊AWS的投资计划最为激进。AWS预计2026年资本支出将达到约2000亿美元,较2025年约1310亿美元的资本支出大幅跃升52.7%,远超市场预期的1466亿美元。这一投资规模直接导致亚马逊股价在盘后大跌11%,反映出投资者对短期回报周期的担忧。亚马逊在2025年第四季度新增算力超1GW,全年资本开支为1318亿美元,同比增长59%。
谷歌的翻倍投资计划同样引人注目。谷歌2026年资本支出定为1750-1850亿美元,同比近乎翻倍,超过此前三年投入总和。2025年第四季度Alphabet资本支出为279亿美元,主要用于技术基础设施,其中约60%投向服务器,40%用于数据中心和网络设备。
Meta的持续加码体现了对AI基础设施的长期承诺。Meta 2025年资本支出达1140-1190亿美元,其中650亿美元用于AI基建;2026年这一数字进一步攀升至1350亿美元。值得注意的是,Meta将2025年全年资本支出范围从600-650亿美元上调到640-720亿美元,主要用于生成式AI以及核心业务方面的投资。
中国云厂商的大规模投入展现了强劲的追赶势头。阿里巴巴宣布未来三年(2025-2027年)将投入超过3800亿元人民币用于建设云和AI硬件基础设施,总额超过去十年总和。腾讯计划2025年进一步加大资本开支,预计占2025年总收入的"低两位数百分比"。字节跳动2025年资本开支或将达到1600亿元,其中900亿元用于AI算力采购,700亿元用于IDC基建以及网络设备。
2.3 芯片供应链紧张状况
军备竞赛期的一个显著特征是核心芯片供应链的极度紧张,这种紧张状况不仅推高了硬件成本,也成为制约AI基础设施建设的关键瓶颈。
GPU供应的严重短缺是最突出的问题。尽管英伟达官方多次辟谣H100/H200芯片不存在短缺,但市场实际情况却呈现出完全不同的景象。H100的租赁价格从2025年10月的1.7美元/小时飙升至2026年3月的2.35美元/小时,半年内涨幅接近40%。新一代芯片"难产",英伟达Blackwell及后续芯片因HBM4内存验证延迟和3nm先进封装良率不足等核心技术瓶颈,交付周期拉长至6-7个月。H100自身产能已达极限,2026年H100全球出货量仅约120万台,交付周期长达12-18个月。
先进制程产能的严重不足加剧了供应紧张。台积电3nm制程产能利用率已突破120%,处于严重供不应求状态。2025年第四季度,3nm制程出货占比28%,良率稳定在80%以上,产能满载且供不应求,订单排期已至2027年上半年。其中,英伟达的AI芯片订单占据3nm产能的45%以上,成为3nm制程增长的核心驱动力。
HBM内存的极度短缺成为AI基础设施建设的最大瓶颈之一。SK Hynix、Samsung和Micron三大厂商2026年的HBM产能已经全部卖光,主要云厂商和GPU巨头通过长期合同锁定了2026年100%的HBM4产能,订单已经排到2027到2028年。AI服务器标配6-12颗HBM,需求是传统服务器的8-10倍,而产能被锁至2028年,缺口高达50%-60%。
中国市场的特殊供应格局呈现出与全球市场截然不同的特征。由于出口管制的影响,英伟达在华市占率从制裁前的95%骤降至2025年的55%,三年时间丢掉40个百分点的市场份额。与此同时,中国本土AI芯片厂商快速崛起,2025年中国AI加速卡总出货量约400万张,本土厂商合计出货165万张,占**41%**的市场份额,其中华为昇腾以81.2万张出货量占20%份额,稳居国产第一。
2.4 各国政府AI战略推动
各国政府在军备竞赛期纷纷推出大规模的AI战略和投资计划,这些政府主导的项目不仅直接推动了AI基础设施投资,也为产业发展提供了强有力的政策支持。
美国政府的"创世纪计划"堪称"曼哈顿计划2.0"。2025年11月底,特朗普推出的"创世纪计划"是20世纪60年代阿波罗太空计划以来最大规模的科学调配与集结行动,是一场由国家主导的科研体系深刻重构。美国能源部已宣布投资超过3.2亿美元,用于打造综合性人工智能实验平台,整合17个国家实验室的超级计算集群,以及数十个联邦科学数据资产。24家顶尖人工智能公司已签署加入该计划。
"星际之门"AI基础设施项目展现了美国政府与企业合作的新模式。2025年1月,特朗普宣布OpenAI、软银集团与甲骨文公司将共同投资5000亿美元打造"星际之门"AI基础设施项目,该项目计划四年内投资5000亿美元,在美国建设10吉瓦算力容量,部署超200万颗AI芯片。该项目初始投资为1000亿美元,并计划在未来4年内扩展至5000亿美元,已与Oracle签约新增4.5吉瓦美国本土数据中心。
中国"十五五"规划的AI战略布局体现了国家意志的强大推动作用。根据《十五五规划纲要》,AI被提升至支柱性产业地位,目标是到2030年相关产业规模突破10万亿元。规划明确将AI大模型列为"卡脖子"技术攻关首位,设立2000亿专项基金,实施人工智能重大科技专项,突破大模型训练推理、智能芯片、框架软件等核心技术。到2030年,中国计划形成10个以上具有国际竞争力的大模型产品,AI核心产业规模突破1.5万亿元。
欧盟AI法案的分阶段实施为AI产业发展提供了规范框架。欧盟《人工智能法案》(AI Act)采取分阶段落地模式,2025年2月2日首批禁止性条款正式生效,2025年8月2日通用AI模型规则生效,2026年8月2日高风险AI系统合规要求生效,2027年8月2日全部条款完全实施。这种渐进式的监管框架既为创新留出了空间,也为产业发展提供了明确的合规指引。
其他国家和地区的AI战略也在加速推进。英国发布了国家AI战略,重点支持AI在医疗、交通、金融等领域的应用;日本推出"Society 5.0"战略,将AI作为实现社会5.0目标的核心技术;韩国制定了"AI Korea Grand Challenge"计划,目标是到2027年成为全球AI强国;新加坡推出"AI Singapore"计划,致力于将新加坡打造成为AI创新中心。
三、产业链各环节表现分析
3.1 上游:芯片与核心组件
军备竞赛期上游芯片与核心组件市场呈现极度供不应求的状态,主要表现为价格飙升、交付周期延长和产能严重不足。
GPU市场的垄断与竞争格局发生了显著变化。英伟达在全球市场继续保持绝对主导地位,2025年第一季度在AIB显卡市场占据**92%**的份额,在游戏GPU市场更是占据95%的绝对份额,AMD市场份额大幅下滑至5%,创下历史最低纪录。然而,在中国市场,由于出口管制的影响,英伟达的垄断地位被打破,市场份额从95%骤降至55%,而中国本土厂商合计占据41%的份额,其中华为昇腾以20%的份额成为国产第一。
AI芯片性能的快速迭代推动了硬件需求的持续增长。英伟达的H100/H200系列虽然已经发布四年,但由于新一代芯片的延迟,仍然是市场上最受欢迎的AI训练芯片。AMD推出的MI300系列GPU在架构设计上表现出色,但在软件生态上仍需加强,目前其市场份额约为15%。预计到2026年,AMD有望将市场份额提升至25-30%。
先进制程产能的极度紧张成为制约整个产业链发展的关键瓶颈。台积电作为全球最先进的晶圆代工厂,其3nm制程产能利用率超过120%,5nm制程贡献36%的营收,两者合计占据61%的营收份额。2nm工艺也取得重要突破,良率突破70%,3nm良率稳定在85%,远超三星2nm的40%-50%和英特尔E8A工艺的55%。
存储芯片的供应危机达到了前所未有的程度。HBM(高带宽内存)作为AI芯片的核心配套,其短缺状况尤为严重。三星、海力士等全球巨头的HBM产能已经被锁至2028年,但市场供需缺口依然超过50%。国内存储芯片企业表现出色,长江存储在手订单超380亿元,排期锁定至2028年底;长电科技在手订单超320亿元,排期锁定至2027年三季度;生益科技在手订单超250亿元,排期锁定至2027年一季度。
3.2 中游:服务器与数据中心
中游服务器与数据中心市场在军备竞赛期呈现爆发式增长,成为整个AI基建投资的核心载体。
AI服务器出货量的翻倍增长直接反映了市场需求的旺盛程度。2025年全球AI服务器出货量达到300万台,同比增长100%;另有数据显示为460万台,同比增长63%。中国市场表现同样强劲,2025年中国AI服务器出货量达到48.8万台,同比增长超过40%。根据IDC数据预测,2025年全年中国加速服务器出货量将同比增长56.3%,达到98.5万台。
AI服务器龙头企业的强劲表现展现了产业集中度的提升趋势。工业富联作为全球AI服务器代工龙头,2025年第一季度AI服务器出货量同比增长213%,其中GB200机柜级产品单季交付量突破5万台,直接推动云计算业务营收占比提升至62%。工业富联在全球高端AI服务器(算力不低于800P)市场占有率达38%,稳居全球第一,领先第二名12个百分点。在英伟达最新的GB200/GB300系列AI服务器代工订单中,工业富联预计将供应1.8-1.9万台,占据约60%的市场份额。
数据中心建设的大规模扩张成为AI基建投资的重要组成部分。截至2025年末,全球运营中的超大规模数据中心达1297个,几乎是2018年初数量的三倍。2025年全球将启动10GW新数据中心算力建设,完工后耗电量相当于英国电力需求的三分之一,全年还有7GW新数据中心竣工,全球总产能已达59GW。截至2025年9月底,全球在建数据中心容量超过23GW,其中约四分之三位于美国。
数据中心建设面临的挑战与风险不容忽视。尽管规划规模巨大,但实际建设进度却存在严重滞后。2026年计划投产规模约为16GW,对应约140个项目,但当前仅有约5GW处于实际施工阶段,占比不足三分之一,意味着超过11GW仍停留在公告或早期阶段。2025年已有26%的预期产能出现延期,另有10%的项目在未充分披露的情况下推迟商业运营时间。基于当前施工比例与历史延期率推算,2026年预计将有30%至50%的规划产能无法按期投运。
3.3 下游:应用与配套设施
下游应用与配套设施市场在军备竞赛期呈现多元化快速发展的态势,成为整个AI产业链价值实现的关键环节。
液冷散热市场的爆发式增长成为下游市场最亮眼的增长点。2025年全球液冷服务器市场规模突破60亿美元,国内市场规模达33.9亿美元,同比增长42.6%。中国液冷服务器市场增速显著高于全球,2025-2029年复合增长率达48%,显著高于全球28.7%的增速。预计到2035年,全球数据中心液冷市场规模将扩大到258亿美元,2025-2035年复合增长率达18.6%。
液冷龙头企业的强劲表现体现了技术创新对市场的驱动作用。英维克作为液冷龙头,2025年液冷业务收入预计25-30亿元,2027年突破100亿元。公司2025年上半年液冷相关营收超2亿元,2026年订单预计增长200%以上,产能处于满产状态。英维克覆盖冷板式与浸没式全技术路线,冷板市占率超50%。高澜股份是唯一覆盖冷板、浸没、集装箱三类液冷方案的厂商。
电力基础设施的巨大投资需求成为AI基建的重要支撑。根据行业分析,2025-2030年数据中心、智能算力中心、超级计算机算力中心所需的投资金额分别为3.4、2.9、2.9万亿元,共计9.2万亿元,每年投资金额为1.8万亿元,约占中国2024年固定资产投资金额的3.6%。高盛预测,电网设备成AI投资最直接受益环节,行业景气周期持续5年以上。
网络基础设施的升级需求推动了光通信产业的快速发展。AI集群对高速互联的需求推动了光模块、交换机等网络设备的技术升级和市场扩张。中际旭创、新易盛、天孚通信等中国企业在全球光模块市场占据领先地位,成为800G/1.6T/CPO等高速光通信技术的核心供应商。
3.4 价格走势与供需关系
军备竞赛期产业链各环节的价格走势呈现普遍上涨的特征,供需关系极度紧张成为常态。
GPU租赁价格的急剧上涨最直观地反映了供需失衡的严重程度。英伟达H100的租赁价格从2025年10月的1.7美元/小时飙升至2026年3月的2.35美元/小时,半年内涨幅接近40%。这种价格上涨不仅反映了硬件短缺,也体现了AI应用对算力需求的持续增长。
存储芯片价格的剧烈波动展现了供应链的脆弱性。AI服务器所需的HBM、企业级SSD持续缺货,价格周涨幅超10%,订单排期至2028年。由于AI需求的爆发式增长,存储芯片价格在短期内出现了数倍的涨幅,但同时也面临着未来产能集中释放可能带来的价格暴跌风险。
数据中心建设成本的快速上升反映了资源稀缺性的加剧。由于电力供应紧张、土地资源稀缺、建设周期延长等因素,数据中心的建设成本在军备竞赛期出现了显著上涨。特别是在电力资源紧张的地区,数据中心的电力成本可能占到总运营成本的50%以上。
供应链价格传导机制的复杂性增加了市场预测的难度。由于上游芯片供应紧张,中游服务器厂商面临着成本上涨和交付周期延长的双重压力。同时,下游应用企业为了确保供应安全,不得不提前锁定产能和签订长期合同,这种行为进一步推高了市场价格。
四、技术演进特征与创新突破
4.1 大模型参数规模演进
军备竞赛期大模型参数规模的演进呈现从千亿级向万亿级跨越的显著特征,这种规模跃升不仅体现在数量增长上,更反映在技术架构和训练方法的创新突破上。
参数规模的指数级增长轨迹清晰地展现了技术演进的加速度。从GPT-3(2020年,1750亿参数)到GPT-4(2023年,1.7-1.8万亿参数)再到GPT-5(2025年预期,十万亿级参数),大模型参数规模遵循每12-18个月翻一番的规律。2025年,这一趋势进一步加速,主流语言模型参数规模平均提升至超过1.5万亿,训练数据量增长近3倍。
中国大模型的跨越式发展展现了技术追赶的强劲势头。阿里通义在2025云栖大会上发布的Qwen3-Max总参数超过1万亿,预训练数据量达36万亿词元,拥有极强的编程能力和工具调用能力。蚂蚁集团开源的全球首个万亿参数推理大模型Ring-1T-preview,其代码生成能力超越GPT-5,数学推理接近人类顶尖水平。上海AI实验室的Intern-S1-Pro基于MoE(混合专家)架构,拥有2410亿总参数、280亿激活参数,在AIME-2025数学推理测试中获得93.1分。
技术架构的创新突破为大规模模型训练提供了新的可能性。MoE(Mixture of Experts)架构通过稀疏激活机制,在保持模型容量的同时显著降低了推理时的计算需求。例如,Ling-1T总参数扩展至1万亿,但每个token仅激活约500亿参数,实现了"大而精"的设计目标。这种架构创新不仅降低了训练和推理成本,也为更大规模模型的开发提供了技术路径。
训练技术的优化进步推动了模型能力的持续提升。混合精度训练结合FP16(半精度)和FP32(单精度)浮点数进行计算,利用FP16的低内存占用和高计算速度,同时通过FP32存储关键参数以保持精度,可降低50%以上的显存占用,提升2-4倍的训练速度。FP8支持在NVIDIA H100 GPU上结合混合精度训练,可将训练速度提升30%以上。
4.2 算力需求模型与预测
军备竞赛期算力需求模型呈现多元化和精细化的发展趋势,不同应用场景对算力的需求特征差异日益明显。
训练算力需求的爆发式增长模型基于Scaling Law定律建立。根据行业标准模型,单次迭代FLOPs≈6×模型参数量×序列长度,完整训练FLOPs=单次迭代FLOPs×训练步数×2(含反向传播)。以GPT-3(175B参数)为例,使用约3000亿Token进行训练,总计算量约为3.15×10²³ FLOPs,如果使用NVIDIA A100 GPU(算力约312 TFLOPS),理论上需要约1000张A100连续运行30天才能完成训练。
推理算力需求的快速增长模型反映了AI应用落地的加速趋势。推理算力需求相对训练需求较小但更加多样化,千亿参数模型的推理算力需求约为10^4 TFLOPs,需要数百张H100支持全球API服务。随着AI应用从实验室走向生产环境,推理算力需求呈现出爆发式增长态势,预计2027年推理占比将达到60%-70%。
多模态模型的特殊算力需求展现了算力需求的复杂性。更复杂的多模态模型(如OpenAI的GPT-5)对算力的需求呈指数级增长,仅视频生成模块的训练就需要超过5000块A100芯片连续运行90天。这种需求特征要求算力基础设施具备更强的灵活性和适应性。
算力需求的时间分布特征呈现出明显的波峰波谷。训练任务通常具有周期性和集中性特征,而推理任务则呈现出持续性和波动性特征。这种时间分布差异对算力资源的调度和管理提出了更高要求,也推动了云计算和边缘计算的协同发展。
4.3 新技术对算力需求的影响
军备竞赛期涌现的各种新技术对算力需求产生了复杂而深远的影响,既有降低需求的优化技术,也有创造新需求的创新应用。
模型压缩与量化技术显著降低了算力需求。INT4/INT8混合精度量化技术在保持模型性能的前提下,可将模型推理速度提升8倍。最新研究显示,在Llama-2-7B、Mistral-7B等模型上,INT4版本在MMLU、HumanEval等基准测试中,精度损失仅为0.3%-0.8%,远低于此前同类工作的3%-5%。这种技术突破为AI模型的大规模部署提供了可能性。
知识蒸馏技术通过将知识从大模型转移到小模型,实现了算力效率的提升。通过知识蒸馏和模型压缩技术,不仅可以控制模型体积,还能有效降低算力需求,同时通过校准方法控制误差在可接受范围内。这种技术路径特别适合资源受限环境下的AI应用部署。
算法优化对算力效率的提升展现了软件创新的巨大潜力。通过改进优化算法、调整网络架构、优化训练策略等方式,可以在不降低模型性能的前提下显著减少算力需求。例如,梯度累积、梯度裁剪、学习率调度等技术的综合应用,可以将训练效率提升数倍。
新兴应用场景创造的算力需求呈现出爆发式增长。AI Agent(智能体)应用的兴起创造了前所未有的算力需求,单个Agent可能需要处理百万级Token的交互,相比传统应用的万级Token需求增长了100倍。自动驾驶、机器人、元宇宙等新兴领域的发展,也为算力需求注入了新的增长动力。
4.4 绿色节能技术发展
军备竞赛期在追求算力规模扩张的同时,绿色节能技术的发展也成为产业关注的焦点,这不仅是技术挑战,更是可持续发展的必然要求。
液冷技术的大规模应用成为实现绿色节能的关键路径。液冷技术利用液体3500倍于空气的热容,将PUE(电源使用效率)从传统风冷的1.5以上降至1.1-1.25区间。冷板式液冷可将PUE降至1.1-1.25,浸没式液冷可将PUE降至1.05-1.1,由于完全去除了风扇,IT设备自身的能耗降低了10%-15%。中国"东数西算"工程明确要求新建数据中心PUE必须低于1.25,甚至1.2,液冷技术成为满足这一要求的必然选择。
政策驱动的能效标准提升为绿色技术发展提供了明确指引。《数据中心液冷系统技术规程》(T/CECS 1722-2024)明确规定,冷板式液冷智算中心验收PUE≤1.25,浸没式液冷智算中心PUE≤1.15。"东数西算"工程对东西部枢纽节点提出差异化能效要求:东部地区新建数据中心PUE≤1.25,西部地区≤1.2。上海从2025年起对PUE>1.35的数据中心实施能耗预警,优先支持液冷、余热回收等示范项目。
可再生能源的大规模应用成为数据中心绿色转型的重要方向。越来越多的数据中心开始采用太阳能、风能等可再生能源,部分先进数据中心已经实现100%可再生能源供电。例如,泰国首个千兆瓦级数字枢纽项目通过22千伏浮动太阳能设施供应42.5兆瓦清洁电力,2027年投入运营。
智能化能源管理系统的发展提升了能源利用效率。通过AI技术优化数据中心的能源调度、温度控制、设备运维等环节,可以在保证算力性能的同时实现能耗的显著降低。机器学习算法可以根据负载变化自动调整制冷系统、服务器集群等设备的运行状态,实现能源的精细化管理。
五、市场格局与竞争态势
5.1 主要玩家市场份额变化
军备竞赛期AI基建市场格局发生了显著而深刻的变化,传统巨头的垄断地位受到挑战,新兴力量快速崛起,市场集中度呈现出既集中又分散的复杂特征。
GPU市场的全球格局依然由英伟达主导,但竞争态势正在发生变化。英伟达在全球AIB显卡市场占据92%的份额,在游戏GPU市场更是占据95%的绝对优势。AMD作为第二大厂商,其MI300系列GPU在架构设计上表现出色,但在软件生态上仍需加强,目前市场份额约为15%,预计到2026年有望提升至25-30%。
中国AI芯片市场的颠覆性变化最能体现市场格局的剧烈调整。由于出口管制的影响,英伟达在华市占率从制裁前的95%骤降至2025年的55%,三年时间丢掉40个百分点的市场份额。与此同时,中国本土AI芯片厂商实现了历史性突破,2025年中国AI加速卡总出货量约400万张,本土厂商合计出货165万张,占**41%**的市场份额。
中国本土厂商的梯队格局呈现出"一超多强"的特征。华为昇腾以81.2万张出货量断层领跑,占国产总出货量的49.2%,市场份额达到20%,稳居国产第一、全球第二。阿里平头哥、百度昆仑芯、寒武纪紧随其后,分别出货26.5万张、11.6万张、11.6万张,构成国产第一梯队。海光信息、沐曦、天数智芯则分别占据约5%、4%、3%的份额,形成差异化补充。
寒武纪的业绩反转展现了中国企业的技术进步和市场竞争力。寒武纪2025年营收64.97亿元,同比增长453%,上市五年来首次实现年度盈利。公司通过大模型适配+国产替代双轮驱动实现业绩反转,短期互联网与运营商订单放量支撑营收高增,2025年营收有望突破100亿元。
5.2 竞争策略与技术路线
各主要玩家在军备竞赛期采取了差异化的竞争策略和技术路线,这种多元化竞争推动了整个产业的快速发展。
英伟达的技术领先与生态优势策略继续发挥主导作用。英伟达通过持续的技术创新保持产品性能领先,H100、H200、GB200等产品在算力密度、能效比等关键指标上保持优势。同时,英伟达通过CUDA生态系统构建了强大的软件壁垒,开发者可以在英伟达平台上获得最佳的开发体验和性能表现。
AMD的架构创新与成本优势策略试图打破英伟达的垄断地位。AMD推出的MI300系列采用了创新的Chiplet架构和HBM2e内存,在某些应用场景下可以提供更好的性价比。AMD还通过开放的软件策略吸引开发者,试图构建与CUDA竞争的软件生态。
中国厂商的国产化替代与技术追赶策略呈现出多样化特征。华为昇腾通过自主研发实现了技术突破,虽然在生态建设上仍有不足,但在特定场景下已经具备了与国际先进产品竞争的能力。寒武纪专注于云端推理芯片领域,通过先发优势和技术积累实现了快速增长。海光信息、沐曦等企业则通过差异化技术路线寻找市场机会。
云厂商的自研芯片策略成为重要的竞争手段。谷歌的TPU、亚马逊的Inferentia、微软的Maia等自研芯片项目,不仅降低了对外部供应商的依赖,也为云厂商提供了差异化竞争优势。这种策略在军备竞赛期得到了更多云厂商的认同和采用。
5.3 中国厂商崛起之路
中国AI芯片厂商在军备竞赛期实现了历史性的崛起,这种崛起不仅体现在市场份额的提升上,更反映在技术能力和产业生态的全面进步上。
政策支持与产业协同的推动作用不可忽视。中国"十五五"规划将AI大模型列为"卡脖子"技术攻关首位,设立2000亿专项基金,为国产AI芯片发展提供了强有力的政策支持。同时,中国庞大的AI应用市场为本土芯片企业提供了丰富的应用场景和迭代机会。
技术突破与产品创新的成果显现。华为昇腾系列芯片在算力性能上已经接近国际先进水平,特别是在特定应用场景下表现出色。寒武纪通过在云端推理芯片领域的技术积累,实现了产品性能的快速提升。阿里平头哥、百度昆仑芯等企业也在各自的技术路线上取得了重要突破。
生态建设的逐步完善为中国厂商的长期发展奠定了基础。虽然与英伟达的CUDA生态相比仍有差距,但中国厂商正在通过开放合作、开发者支持、应用示范等方式逐步构建自己的软件生态。特别是在一些垂直应用领域,中国厂商已经建立了相对完整的解决方案体系。
产业链协同发展的优势为中国厂商提供了独特的竞争优势。中国拥有从芯片设计、制造、封测到应用开发的完整产业链,这种产业协同效应在军备竞赛期得到了充分发挥。特别是在面对外部技术封锁的情况下,这种产业链完整性成为中国厂商的重要竞争优势。
5.4 产业链整合与生态构建
军备竞赛期推动了AI产业链的深度整合与生态重构,这种整合不仅体现在企业层面的并购重组,更反映在产业生态的系统性变革上。
垂直整合趋势的加强成为产业发展的重要特征。越来越多的企业开始构建从芯片设计到应用开发的全栈解决方案,试图通过垂直整合获得竞争优势。例如,华为构建了包括昇腾芯片、服务器、网络设备、云计算平台在内的完整AI基础设施体系。这种垂直整合模式在军备竞赛期得到了更多企业的认同和采用。
开放生态与合作联盟的兴起为产业发展注入了新的活力。面对技术复杂度的提升和市场竞争的加剧,企业之间的合作变得越来越重要。例如,中国的AI开源联盟通过技术共享和标准制定,推动了本土AI生态的发展。国际上,一些企业也开始通过开放合作的方式构建更大规模的产业联盟。
标准化与规范化的推进为产业健康发展提供了保障。在军备竞赛期,随着技术的快速发展和应用的广泛普及,标准化和规范化的重要性日益凸显。从芯片接口标准到数据格式规范,从性能评测标准到安全认证体系,各种标准的制定和完善为产业发展提供了重要支撑。
区域化发展格局的形成反映了地缘政治对产业发展的影响。由于技术封锁和贸易限制的影响,全球AI产业正在形成以美国、中国、欧盟为核心的区域化发展格局。每个区域都在构建相对独立的技术体系和产业生态,这种格局变化对未来产业发展将产生深远影响。
六、影响评估与风险分析
6.1 资本市场影响
军备竞赛期对资本市场产生了深远而复杂的影响,这种影响不仅体现在相关企业估值的剧烈波动上,更反映在投资逻辑和市场预期的根本性变化上。
英伟达的历史性市值突破成为AI投资热潮的标志性事件。2025年7月9日,英伟达股价冲破163.93美元,成为人类历史上市值首家突破4万亿美元的公司,这一数字超过了英国、法国或德国任一国家的股票总市值。2026年4月14日,英伟达股价进一步上涨至196.51美元/股,市值达到4.8万亿美元。英伟达的成功不仅体现了AI技术的巨大商业价值,也推动了整个科技股估值体系的重构。
AI概念股的普遍上涨反映了市场对AI产业前景的乐观预期。根据高盛的最新科技基础设施报告,AI基础设施供应链公司的股票估值自投资计划公布以来平均上涨了40%。从芯片制造商到数据中心运营商,从服务器厂商到软件开发商,整个AI产业链的上市公司都获得了显著的估值提升。
中国AI企业的估值重塑展现了本土市场的巨大潜力。在国产化替代的背景下,中国的AI芯片企业、服务器厂商、云计算公司等都获得了重新估值的机会。例如,寒武纪在实现扭亏为盈后,其估值水平得到了显著提升。一些新兴的AI应用企业也通过IPO等方式进入资本市场,获得了快速发展所需的资金支持。
投资泡沫风险的累积引起了市场的担忧。尽管AI产业前景广阔,但当前的投资热潮也存在泡沫化风险。一些分析认为,美国科技股市值中约30%(约150万亿元)依赖不切实际的AI预期,远超中国全年GDP。这种过度乐观的预期可能导致估值脱离基本面,一旦市场情绪逆转,可能引发剧烈的调整。
6.2 产能过剩风险
军备竞赛期的一个重要风险是潜在的产能过剩问题,这种风险在不同环节和不同时期表现出不同的特征和影响程度。
数据中心建设的产能过剩风险已经开始显现。根据行业分析,全球企业正试图在一到两年内建成十年的数据中心产能,但"这些数据中心具体要做什么,还没有完全想清楚"。美国2026年16吉瓦的规划产能中,30%-50%面临延期或取消,真正动工的约5吉瓦;2027年对应交付的在建规模只有6.3吉瓦,对比市场预期的15吉瓦存在巨大差距。
存储芯片的产能过剩风险尤为突出。集邦咨询警告,NAND新增产能将在2027-2028年大规模释放,如果届时AI商业化落地速度不及预期,如此集中的供给撞上需求放缓,可能重演2018年DRAM价格暴跌50%的历史。关键风险节点是2027年底至2028年,观察指标是存储芯片价格和高端PCB的产能利用率。
AI服务器的结构性过剩风险也值得关注。虽然整体需求旺盛,但在某些细分市场可能出现过剩。例如,如果大模型训练需求增长放缓,而推理需求增长不及预期,可能导致高端训练服务器的需求下降,进而引发价格竞争和库存积压。
产能过剩的连锁反应风险可能对整个产业链造成冲击。如果出现大规模产能过剩,可能导致上游需求"瞬间冰封",引发产业链的"塌方式"衰退。芯片订单将骤降70%-90%,台积电、三星等晶圆厂产能利用率暴跌,大量光模块、PCB、存储芯片厂商陷入亏损、停产与裁员。
6.3 与互联网泡沫的对比分析
当前的AI投资热潮与2000年互联网泡沫存在相似性和差异性,通过对比分析可以更好地理解当前投资环境的特点和风险。
相似性分析主要体现在以下几个方面:
概念炒作与估值脱离:互联网泡沫时期,许多企业仅凭概念就获得了极高估值;当前AI热中,OpenAI年亏50亿美元,估值却高达340亿美元,42倍的估值全靠未来想象支撑。
资本扎堆与盲目跟风:互联网泡沫时期,大量资本涌入互联网领域;2025年全球AI融资超1900亿美元,占全球VC投资的一半。
基础设施投资过度:互联网泡沫时,电信公司铺设8000万英里光纤,实际利用率不足20%;当前AI投资中,也存在类似的基础设施投资过度问题。
差异性分析主要体现在以下几个方面:
产业基础的扎实程度:互联网泡沫时期,仅14%的企业盈利,商业模式不清晰;当前AI产业中,微软、谷歌等巨头已建立成熟商业模式,标普科技板块净利润率达27.7%。
技术落地的成熟度:互联网泡沫时期,技术应用多停留在概念阶段;当前AI已在医疗、金融、自动驾驶等领域实现实际应用,企业渗透率虽然小于15%但在快速提升。
资金来源的可靠性:互联网泡沫时期,企业多依赖高杠杆融资;当前AI巨头依赖自有现金流,资本充足率比2000年提升47%。
估值水平的合理性:互联网泡沫时期,纳斯达克市盈率曾达200倍;当前仅35倍左右。
6.4 地缘政治与供应链风险
军备竞赛期的地缘政治因素对AI供应链产生了深刻而持久的影响,这种影响正在重塑全球AI产业格局。
技术封锁与出口管制的影响已经成为影响产业发展的关键变量。美国对中国的高端芯片出口管制不仅影响了中国企业的技术获取,也推动了中国本土AI产业的快速发展。英伟达在华市占率从95%降至55%,而中国本土厂商的市场份额提升至41%,这种变化直接反映了地缘政治对市场格局的影响。
供应链重构的加速推进正在形成新的产业格局。面对技术封锁的风险,各国都在努力构建更加自主可控的供应链体系。中国通过政策支持和产业投资,推动了本土芯片设计、制造、封测等环节的发展。美国则通过产业政策和国际合作,试图构建排除中国的技术联盟。
标准制定权的争夺成为地缘政治竞争的新战场。从技术标准到安全规范,从数据格式到接口协议,各种标准的制定权成为各国争夺的焦点。这种争夺不仅影响技术发展方向,也决定了未来产业竞争的规则体系。
产业链区域化的趋势日益明显。由于地缘政治的影响,全球AI产业链正在形成以美国、中国、欧盟为核心的三大区域体系。每个区域都在努力构建相对独立的技术体系和产业生态,这种格局变化对未来产业发展将产生深远影响。
七、结论与展望
7.1 军备竞赛期总结
AI基建军备竞赛期(2025-2027年)是人类历史上最大规模的基础设施建设浪潮之一,其规模、速度和影响都远超市场最初的预期。通过对这一时期的深入分析,可以得出以下核心结论:
40%+高速增长的验证与特征:军备竞赛期确实呈现了40%以上的高速增长,这一判断得到了多方数据的验证。2025年全球AI基础设施支出达到318亿美元(同比+107.6%),全球AI总支出达到1.48万亿美元(同比+50%)。2026年预计全球AI支出将达到2.52万亿美元(同比+70%),2027年将突破3.34万亿美元(同比+33%)。这种增长主要由云厂商资本开支爆发、大模型训练需求激增、供应链瓶颈推高等因素驱动。
技术突破与产业变革的深度融合:军备竞赛期不仅是投资规模的扩张,更是技术创新的集中爆发期。大模型参数规模从千亿级跨越到万亿级,中国企业在这一进程中实现了历史性突破,阿里、蚂蚁、上海AI实验室等机构相继推出万亿参数级模型。同时,液冷技术、AI芯片架构、训练优化算法等关键技术的突破,为产业的可持续发展奠定了基础。
市场格局的根本性重塑:军备竞赛期推动了AI产业格局的深刻变化。英伟达虽然在全球市场保持主导地位,但在中国市场的垄断地位被打破,市场份额从95%降至55%。中国本土厂商实现了历史性崛起,华为昇腾以20%的市场份额成为国产第一,本土厂商合计占据41%的市场份额。这种格局变化不仅反映了技术能力的提升,更体现了产业生态的重构。
风险与机遇的并存发展:军备竞赛期在创造巨大机遇的同时,也积累了不容忽视的风险。一方面,数据中心建设存在产能过剩风险,2026年规划的16吉瓦产能中30%-50%可能延期或取消;另一方面,存储芯片等关键组件面临2027-2028年集中产能释放的价格风险。与互联网泡沫相比,当前AI投资具有更扎实的产业基础和更清晰的商业模式,但仍需警惕过度投资和估值泡沫的风险。
7.2 后续阶段展望
基于军备竞赛期的发展态势和产业规律,对后续阶段(2027-2030年)的发展趋势可以做出以下前瞻性判断:
推理爆发期(2027-2028年)的特征与机遇:这一阶段将呈现从训练主导向推理主导的结构性转变,推理算力需求预计将超过训练需求,占比达到60%-70%。随着AI应用从实验室走向大规模商业部署,推理基础设施投资将迎来新的增长高峰。同时,边缘计算、AI Agent等新兴应用场景将创造全新的算力需求,推动算力架构向云边协同方向发展。
成熟优化期(2028-2030年)的发展路径:这一阶段将以普惠AI、能效优化为主要特征,AI技术将从"奢侈品"转变为"日用品"。随着技术成熟度的提升和成本的下降,AI将在更多领域实现规模化应用。同时,绿色节能技术将成为竞争焦点,PUE值的持续优化将推动液冷技术的全面普及,可再生能源的应用比例将大幅提升。
中国产业发展的战略机遇期:基于军备竞赛期的发展基础,中国AI产业在后续阶段将迎来重要的战略机遇期。随着技术能力的提升和产业生态的完善,中国有望在某些细分领域实现领先。特别是在应用创新、成本控制、产业协同等方面,中国具有独特的优势。预计到2030年,中国AI核心产业规模将突破1.5万亿元,形成10个以上具有国际竞争力的大模型产品。
全球产业格局的演进趋势:后续阶段全球AI产业将呈现多极化发展趋势,美国、中国、欧盟将形成相对独立但又相互竞争的产业体系。技术标准的制定、供应链的重构、市场规则的建立将成为各方竞争的焦点。同时,随着技术的成熟和应用的普及,AI将从少数科技巨头的专利转变为全社会的基础设施,推动人类社会进入智能时代。
7.3 投资建议
基于对军备竞赛期的深入分析和后续阶段的展望,对不同类型的投资者提出以下具体建议:
对产业投资者的建议:
1.关注技术拐点和应用爆发:在推理爆发期,应重点关注推理芯片、边缘计算、AI Agent等技术方向,以及自动驾驶、智能制造、智慧医疗等应用领域的投资机会。
2.重视产业链安全与自主可控:在地缘政治不确定性增加的背景下,应重点关注具有自主技术能力和完整产业链布局的企业,特别是在芯片设计、关键材料、核心设备等环节具有突破的企业。
3.平衡规模扩张与效率提升:在成熟优化期,应更加注重投资标的的盈利能力和可持续发展能力,避免盲目追求规模扩张。
对财务投资者的建议:
4.把握结构性机会:在不同阶段重点关注不同的投资主题。2027-2028年重点关注推理基础设施、边缘计算等领域;2028-2030年重点关注AI应用、绿色节能技术等领域。
5.控制风险敞口:鉴于产能过剩和估值泡沫的风险,应合理控制AI相关投资的比例,避免过度集中。同时,应重点关注具有真实业绩支撑和清晰商业模式的企业。
6.关注中国市场机会:中国AI市场具有巨大的增长潜力和独特的发展优势,应重点关注具有技术突破和市场地位的中国企业。
对政策制定者的建议:
7.加强产业政策的前瞻性和协调性:应基于产业发展规律和技术演进趋势,制定更加科学合理的产业政策,避免盲目跟风和重复建设。
8.推动技术创新和标准制定:应加大对基础研究和关键技术攻关的支持力度,同时积极参与国际标准制定,提升中国在全球AI治理中的话语权。
9.平衡发展与安全的关系:在推动产业发展的同时,应高度重视数据安全、算法公平、就业影响等社会问题,确保AI技术的健康发展。
总体而言,AI基建军备竞赛期是一个充满机遇与挑战的历史阶段。通过科学分析和理性判断,投资者可以在这一轮产业变革中获得丰厚回报,同时为人类社会的智能化转型做出贡献。关键在于把握趋势、控制风险、理性投资,共同推动AI产业的健康可持续发展。
夜雨聆风