—
会议纪要
第三方专家发言内容仅代表其个人观点,所有信息或所表述的意见并不构成对任何人的投资建议。
Q:中国 AI 市场未来两三年的核心矛盾是什么?
未来两到三年,中国算力市场甚至全球算力市场仍然是供小于求的格局。对 2026 年中国 AI 市场来说,核心矛盾不是需求有没有,而是算力能不能真实交付。算力供给背后又受到产能、供应链、芯片、封装、服务器 OEM、数据中心、电力等多环节制约,所以今年 A 股投资里最重要的观察变量,就是谁真正具备算力交付能力。
从供给来源看,中国 AI 算力今年具备交付能力的主要包括三类:算力租赁、国产算力、英伟达中国特供款。其中国产算力和算力租赁会成为国内 AI 算力市场最主要的供给力量。围绕下一代技术演进,后续还需要重点关注超节点、OEM、CPU 等方向。
受益环节包括半导体里的 GPU、switch、存储、CPU、超节点 OEM、交换机 OEM,也包括服务器组件里的散热、光模块、连接器、电源、PCB、存储,以及算力租赁、云计算、数据中心、ICT 制造设备等。
Q:为什么说 2026 年会是 AI 推理的重要阶段?
2025 年以来,Claude Code 等 AI 编程工具开启了 agentic AI 的应用阶段,推动软件工程、AI 编程以及整个 AI 软件行业发生快速变化。AI agent 的出现,使推理需求从单纯问答扩展到代码生成、工具调用、任务执行和流程自动化。
英伟达对 Blackwell、Rubin 等产品的收入预期,本质上就是受益于 AI 推理拐点带来的强劲需求。AI 需求也不再只来自互联网云厂商,而是扩散到主权云、区域云、企业、物理 AI、工业、自动驾驶、机器人等场景。
从 Anthropic 工具调用结构看,目前软件工程占调用量接近 50%,而传统软件行业中占比较大的金融、教育、医疗、客服等领域,在 Anthropic 调用量中的占比都还不到 10%。这意味着当前 AI agent 的需求只是率先在软件工程领域爆发,未来随着模型能力提升和应用创新加速,金融、教育、医疗、客服等环节还有可能进一步打开推理市场空间。
Q:中国为什么在 AI 推理时代具备更大增长潜力?
中国有两个优势。第一是 C 端用户基础足够大。到 2025 年 12 月,中国网民规模达到 11.25 亿,互联网普及率超过 80%,生成式 AI 用户规模超过 6 亿,同比 2024 年增长 141.7%。这意味着中国具备非常广阔的 AI 应用土壤。
第二是产业基础深厚。中国制造业和工业场景复杂且丰富,未来 AI 推理不仅会服务 C 端应用,也会下沉到大量制造业细分场景。这些工业场景会成为 AI 推理新的市场。
此外,中国模型也不只服务国内市场,也在推进 token 出海。Kimi、MiniMax、智谱等在海外市场均有突破。以 MiniMax 为例,2025 年收入中约 73% 来自国际市场。在 OpenRouter 最新调用量前十大模型里,中国国产模型占据 6 个席位,腾讯、DeepSeek 位列前二。这反映出国产模型未来在 token 出海方面具备较强增长潜力,也会反过来带动中国 AI 算力需求。
Q:全球和中国 AI 资本开支规模怎么看?
北美五大 CSP 厂商 2026 年资本开支仍会高速增长。亚马逊、谷歌、Meta、微软、Oracle 的资本开支预计分别达到 2300 亿美元、1850 亿美元、1350 亿美元、1900 亿美元和 1045 亿美元,合计约 8145 亿美元,同比增长约 81%。这意味着北美五大 CSP 已经连续三年实现 60% 以上的资本开支增长。
资本开支中 AI 开支占比持续提升,过去三年 AI 资本开支的复合增速可能已经超过 100%。英伟达也提到,2030 年末 AI 行业整体开支规模可能达到 3 万至 4 万亿美元,这意味着未来三到五年 AI 算力仍然具备很强增长空间。
回到中国市场,腾讯、阿里、字节等三大 SSP/CSP 预计 2026 年仍会继续加大资本开支投入,较 2025 年进一步提速。结合各家公司表述和第三方数据,2026 年中国 AI 市场最核心的问题,就是算力供给和交付。
Q:国内算力供给主要来自哪些方向?
国内算力供给主要来自四类:算力租赁、国产算力、英伟达中国特供款,以及海外衔接算力。其中国产算力和算力租赁具备相对更确定的交付能力,因此会成为国内算力供给的核心支撑。
这也是今年投资判断的重点:不是只看产业趋势,也不是只看订单想象空间,而是看谁能拿到产能、谁能组织供应链、谁能真正交付算力。
Q:国产算力为什么会在 2026 年迎来产能、产品和需求的多重驱动?
从产品看,GPU 仍然是全球 AI 算力的主要品类。英伟达围绕 Rubin 的芯片和算力产品集群,已经体现出 GPU 分工逐步精细化的趋势。今年 GTC 上推出的 LPU,主要针对 AI 推理场景,是对通用 GPU 的重要补充。AI 算力芯片未来会按照训练、推理、任务执行等不同场景进一步分化。
ASIC 也是重要趋势。ASIC 是为特定需求设计的专用芯片,相比通用芯片卸载了不必要的逻辑单元,可以在特定应用里优化芯片面积、数据处理速度、能耗和计算效率。北美 CSP 如亚马逊、谷歌,以及中国 CSP 如阿里、字节、百度等,都在扩大自研 ASIC。未来三到五年,ASIC 在 AI 芯片中的占比预计会进一步提高。
从价值量看,AI 芯片仍然是 AI 算力服务器里价值占比最高的环节。在 GB200 里,B200 芯片占 BOM 比例约 72%。未来 AI 芯片在整机价值量里仍会占据一半甚至一半以上。
Q:国产 AI 芯片目前处在什么阶段?
国内算力厂商如华为、海光、寒武纪等都在持续迭代新产品。2026 年,华为预计推出昇腾 950P2 和昇腾 950DT,并在算力精度上进一步下沉到 FP4,内存和内存带宽较上一代也会提升。海光深算三号、后续深算四号,以及寒武纪 690 等,也有望在 2026 年释放更强产品力。
已经上市或拟上市的国产 AI 芯片公司,如壁仞科技、沐曦股份、摩尔线程、燧原科技、天数智芯等,也会呈现类似趋势。未来两到三年,国产算力产品性能会持续迭代,并继续追赶国际先进水平。
从出货量看,2025 年国内 AI 芯片出货量约 400 万颗。2026 年到 2027 年,国产 AI 芯片,包括第三方 GPU 和互联网自研 ASIC,预计都有望实现超过 100% 的复合增速。
Q:国产 AI 芯片当前最大的瓶颈是什么?
当前国产算力性能已经能够较好满足国内推理需求,但仍然面临先进制程工艺的产能瓶颈。代表性国产 AI 企业都在大幅增加存货采购和预付款,用于锁定产能、保障供应。
例如海光信息一季度末预付款同比增长 112.5%,达到 34 亿元;寒武纪一季度末预付款和存货也处在较高水平;沐曦存货也在增长。面对国内推理需求强劲和先进产能供不应求的背景,国产 AI 芯片厂商未来会以交付能力作为主要判断依据。
因此,与晶圆厂、封测厂、封装厂等供应链环节形成深度合作的企业,在未来产能获取和产品交付上更容易超预期。
Q:国产模型对国产芯片的支持情况如何?
国内模型正在积极适配国产芯片。DeepSeek V4 预览版发布后,拥有 100 万 token 超长上下文能力,性能比肩顶级闭源模型,并达到当前开源模型的较高水平,同时定价显著低于 GPT-5 和 OpenAI o 系列模型。
DeepSeek 在技术报告中提到,V4 在英伟达 GPU 和华为昇腾 NPU 两个平台上都验证了专家并行方案。深度优化后,V4 在华为昇腾芯片上的推理速度较初期版本提升 35 倍。华为 CANN 框架和英伟达 CUDA 框架的代码兼容性已经接近 95%。
如果下半年昇腾 950 超节点批量上市部署,V4 Pro 版本价格还有望进一步下调。寒武纪、海光信息等也已宣布完成 DeepSeek V4 适配。国产模型与国产芯片的互相适配,会是今年国产算力落地的重要推动因素。
Q:算力租赁的商业模式是什么?
算力租赁本质是裸金属 GPU 出租。客户向算力租赁厂商支付租金,获得 GPU 访问权限。目前算力租赁公司除了提供 GPU 裸金属租赁,也在提升软件服务能力,甚至和模型厂商合作,提供类似 token 分销的服务。
这个模式和云计算有相似之处,但区别在于,云厂商是计算、存储、网络、通用算力、AI 算力全都提供的“百货商场”,而算力租赁主要专注于 AI 芯片和 AI 集群。因为专门针对 AI 集群部署,算力租赁在集群优化、模型算力利用效率上可以做得更极致。
算力租赁也是云厂商上游的重要算力供应商。
Q:算力租赁为什么受到英伟达等上游厂商重视?
算力租赁公司正在成为 AI 基础设施的重要组成部分。海外来看,英伟达已经投资 CoreWeave 和其他 AI 算力租赁公司,支持这些企业在 2030 年前部署超过 5GW 的 AI 数据中心基础设施。
算力租赁的核心优势有三点。第一,它专门为人工智能打造,架构和机型设计中去除了部分 AI 不需要的托管服务,使模型浮点利用率高于行业平均水平,变相提高芯片利用效率。第二,它凭借融资能力,一定程度上缓解互联网厂商一次性资本开支压力。第三,它通过生态关系,一方面可以更早拿到英伟达芯片做适配,另一方面可以积极获取电力和 IDC 资源。
Q:算力租赁主要有哪些收费模式?
目前主要有两种模式。一种是两到五年的承诺合同,另一种是按需付费的零售模式。现在主要收入来自合同模式。
合同模式下,算力租赁公司承诺在固定时间段内为客户预留一定算力容量,客户按照固定价格使用。这样可以给算力租赁公司带来现金流和收入的稳定性。为了避免客户违约,客户通常也会预付一部分款项。
Q:云厂商涨价对算力租赁意味着什么?
云厂商近期陆续对 AI 云服务涨价,反映出整个算力行业供需紧张。存储、CPU 等上游环节涨价,也会继续传导到算力租赁价格,进一步传导到 token 价格。
这其中存在一个正循环:算力涨价推动 token 涨价,而 token 涨价又会反过来提升算力资产的回报预期,进一步强化算力租赁、服务器等上游环节的涨价逻辑。
Q:国内算力租赁公司的业绩是否已经兑现?
国内算力租赁公司已经进入业绩兑现期。协创数据一季度净利润同比增长 3.4 倍,环比增长约 60%,增长来自大型算力集群及综合服务项目在本季度交付并通过客户验收,全面进入计费阶段。自 2025 年以来,协创数据累计采购公告金额已经超过 322 亿元。
利通电子 2026 年一季度收入达到 10 亿元,同比增长 40%,归母净利润同比增长 8 倍以上,环比增长 2.5 倍,主要来自与腾讯等云厂商签订的算力长期协议。
因此 2026 年对算力租赁来说,是业绩高速释放阶段。在国内供不应求背景下,具备交付能力的算力租赁公司,业绩增长潜力值得关注。
Q:算力租赁公司融资扩张怎么看?
协创、弘景、盛世绿通、银丰正威等公司都披露了相关融资规划。融资的意义在于提前准备算力采购资金,以便在供给紧张周期里锁定设备、锁定客户、实现交付。算力租赁行业不是轻资产扩张,谁能融资、谁能拿货、谁能交付,会直接决定后续业绩弹性。
Q:为什么超节点 OEM 会成为下半年新的关键环节?
随着英伟达 GB200 在全球大规模销售和上线,以及国内超节点方案下半年推出,超节点 OEM 会成为国产算力和算力租赁新的关键环节。
超节点是通过高速互联协议,将数十个至数百个 GPU 紧密整合,形成逻辑统一编址、高带宽、低延时的协同计算系统。这些设备处于同一个 HBD/高带宽域。超节点不是简单堆砌 AI 芯片,而是让多个计算设备像一台计算机一样工作、学习、思考和推理。
超节点的核心技术特征包括更大带宽、更低延时、内存统一编址、资源池化。底层技术涉及高速互联、内存池化、CPU IP 指令深度控制等。
Q:超节点为什么会提高 OEM 难度?
以英伟达 Rubin NVL72 为例,一个超节点系统会集成大量独立组件和芯片,封装在一个机架内,重量和功率密度都大幅提升。高密度超节点机架对 OEM 厂商提出了新的组装、液冷、电源、互联、可靠性、调试和交付难题。
2025 年英伟达推出 GB200 NVL72 超节点过程中,OEM 竞争格局已经出现集中,龙头市占率进一步提升,盈利能力也改善。超节点方案越复杂,越有利于具备系统集成、供应链管理、液冷、电源和交付能力的龙头 OEM。
Q:国内超节点进展如何?
华为预计在 2026 年四季度推出 Atlas 950 SuperPod 超节点。Atlas 950 通过芯片、器件、协议、算法、光电技术进行系统级创新,采用零线缆电互联、液冷接头浮动盲插设计,并创新 UB-Mesh 拓扑网络架构,支持单板内、单板间、机柜间 NPU 全互联,最大可实现 8192 卡无收敛全互联。
华为还计划在 2027 年四季度进一步推出 Atlas 960 超节点。
中科曙光也在深耕超节点。2025 年,中科曙光推出单柜级 640 卡超节点,包含四个机箱,每个机箱 10 个刀片,采用两个 CPU 配八个 DC 的方式,并使用静默式相变液冷、400V/800V HVDC、柜内全电互联正交架构等技术。这个 640 卡超节点的单柜功率约 860kW,在高密度下仍体现出较强能效管理能力。
阿里在 2025 年 9 月发布新一代磐久 128 卡 AI 服务器超节点,未来可能集成阿里自研 PPU,并通过多元架构集成更多 AI 芯片。
因此 2026 年会是中国超节点元年。国产算力和算力租赁都会面对超节点方案落地,超节点 OEM 也会成为重要投资方向。
Q:CPU 为什么会成为 AI 算力的新重点?
CPU 在 AI 系统里承担“空中交通管制员”的角色。随着 AI 从训练走向推理和智能体执行,需要更多 CPU 处理数据加载、数据预处理、调度、内存管理、批量处理、推理路由等任务。
如果 CPU 处理能力不足,就会导致 GPU 和存储芯片闲置。而 GPU 和存储是 AI 服务器里价值占比最高的部分,所以 CPU 核数和性能提升,对提高整机资源利用效率和用户体验非常关键。
推理时代,CPU 战略地位会被重构。当前 AI 数据中心 CPU 与 GPU 比例大致是 1:4 到 1:8。进入 AI 智能体时代,这个比例有望演变到 1:1,部分场景甚至可能出现 CPU 与 GPU 4:1 的配置。英伟达最新 Rubin 集群里,CPU 与 GPU 比例已经接近 1:1。
Q:CPU 涨价和产业变化说明了什么?
CPU 需求增加不只是逻辑预期,已经开始进入基本面变化阶段。英特尔今年以来多次提价,说明 CPU 供需已经发生边际变化。
英伟达也提到,Vera CPU 为其打开了新的约 2000 亿美元市场。未来 CPU 有可能成为下一个接近存储级别的重要环节。AI 推理、智能体、多任务调度、KV cache 管理等需求,都在推动 CPU 价值重估。
Q:投资上重点关注哪些方向?
AI 算力主线仍然值得重点关注,尤其是中国 AI 算力交付相关环节。
半导体方向包括 GPU、switch、CPU 等。GPU 可关注海光信息、寒武纪、壁仞科技、沐曦股份等;switch 可关注南凌科技、盛科通信等;CPU 可关注中国长城、曙光信息等。
超节点 OEM 方向包括浪潮信息、联想集团、中科曙光、曙光股份、华勤技术、工业富联等。交换机方向可关注锐捷网络等。
服务器组件方向包括散热、光模块、电源、连接器、PCB、存储等。散热可关注鼎通科技、曙光数创、飞龙股份、飞荣达、申菱环境等。
算力租赁方向包括协创数据、盛世科技、利通电子、弘信电子、润建股份等。
数据中心与算力基础设施方向包括世纪互联、奥飞数据、润泽科技等。
ICT 制造设备方向包括联讯仪器、罗博特科等。
Q:主要风险是什么?
风险主要包括宏观经济影响、下游需求不及预期、模型产业发展不及预期、市场竞争加剧、中美博弈加剧,以及相关公司业绩不及预期。
整体上,今年中国 AI 算力投资的核心不是单纯看谁有概念,而是看谁具备真实交付能力。国产算力、算力租赁、超节点 OEM、CPU 和服务器组件,都是围绕“交付”这一核心矛盾展开的关键方向。
🔔Capital at risk
夜雨聆风