乐于分享
好东西不私藏

【认知差不差】AI推理侧异构算力:被市场低估的确定性增量与国产龙头机遇

【认知差不差】AI推理侧异构算力:被市场低估的确定性增量与国产龙头机遇

AI推理需求的爆发式增长,正在将市场对算力的关注焦点从单一的GPU训练,引向一个更为多元、更具性价比的异构算力世界。当前市场存在显著的预期差:过度聚焦GPU,而忽视了推理侧对CPU、ASIC、高速互连芯片以及配套电源/液冷解决方案的增量需求。这一需求拐点已由谷歌、字节等巨头明确的技术路线和采购预算验证,并直接驱动了国产供应链的订单与业绩兑现节奏。核心判断是:AI推理侧的非GPU半导体需求正进入加速放量期,其中具备技术卡位和订单验证的国产龙头,将在未来1-2个季度迎来业绩与估值的双击窗口。

一、 宏观需求拐点:从训练到推理,算力架构的必然演进

AI产业正从“模型军备竞赛”的投入期,转向追求商业化和效率的“应用落地期”。这一转变直接催生了两个确定性趋势:

  1. 推理需求占比飙升:
    摩根士丹利等机构报告指出,随着大模型应用(如AIGC、智能体)的普及,推理算力消耗将迅速超越训练,成为算力需求的主体。推理任务具有高并发、低延迟、能效敏感的特点,对算力架构提出了与训练截然不同的要求。
  2. 成本与效率驱动异构化:
    纯GPU集群并非推理任务的最优解。CPU在处理复杂逻辑、ASIC在特定模型推理上的能效比优势,以及CXL等技术带来的内存资源池化,使得“CPU+ASIC+GPU+高速互连”的异构计算架构成为必然选择。

关键催化事件:谷歌在近期云大会上明确,其新一代TPU v8将深度整合CXL内存池化技术,将内存利用率从40%提升至90%以上,并计划在2026年将TPU出货量目标大幅上调50%。这为CXL技术的规模化商用定标,也验证了推理侧对内存效率和互连带宽的迫切需求。同时,产业链情报显示,字节跳动已将2026年GPU采购预算从1600亿元上调至2300亿元,并大幅增加对HWJ、昇腾等国产芯片的采购,其中推理芯片占比显著提升。

二、 中观产业链拆解:哪些环节将迎来确定性增长?

推理侧算力需求的爆发,将沿着“算力核心->数据通路->能源保障”的路径,对半导体产业链产生结构性拉动。

1. 算力核心:ASIC与CPU的国产化机遇

  • ASIC设计服务/IP:
    推理场景的定制化需求,催生了专用芯片(ASIC)的繁荣。国产芯片设计服务龙头凭借在先进工艺上的积累,正获得国际巨头的订单验证。据产业链信息,某国产ASIC设计服务商一季度新增订单高达45亿元,验证了其技术能力与市场卡位。
  • CPU:
    在推理服务器中,CPU不仅承担控制、调度任务,更在部分负载均衡、轻量级模型推理中扮演算力角色。深度绑定国内互联网大厂、且产品线覆盖从通用计算到AI加速的国产CPU厂商,将直接受益于下游推理需求的放量。

2. 数据通路:内存、互连芯片的量价齐升

  • 存储芯片:
    大模型参数激增带来海量内存需求。伯恩斯坦的产业链情报显示,2026年第二季度DRAM和NAND的合同价涨幅可能远超市场预期,分别达到环比60%和70-75%。这为存储芯片制造商带来了明确的利润弹性。
  • 高速互连芯片:
    谷歌TPU对CXL技术的采纳,是引爆点。CXL内存扩展控制器(MXC)及PCIe Retimer芯片需求将随AI集群规模扩大而激增。全球CXL MXC芯片龙头澜起科技(688008.SH)已向谷歌送样,单颗TPU配套2颗CXL芯片的假设下,仅谷歌客户就能带来百万级芯片需求增量。

3. 能源保障:高功率电源与液冷成为刚需

  • 高端电源:
    算力密度提升,单机柜功率从6-8kW向12kW甚至更高演进。高盛在台达电子的研报中指出,新一代12kW AI电源单价是旧款的2倍以上,且HVDC(高压直流)电源架构普及速度超预期,ASP(每瓦价格)有望大幅提升。这为电源厂商带来量价齐升的逻辑。
  • 液冷解决方案:
    高密度算力必然伴随高功耗散热问题。液冷从选项变为必选项。据相关研报,银轮股份(002126.SZ)已获得某头部客户(G客户)高达50亿元的液冷业务潜在订单,其数字能源业务收入2025年增长达42.86%,第二成长曲线正在形成。

三、 微观标的聚焦:芯原股份(688521.SH)的订单驱动逻辑

在AI推理驱动的异构算力浪潮中,芯原股份(688521.SH) 是具备明确订单验证和业绩弹性的核心标的。

  • 核心逻辑:公司是全球领先的芯片设计服务和IP授权供应商。在AI推理侧,其两大业务直接受益:

    1. 芯片设计服务:
      为客户提供从规格定义到流片的全流程定制化设计,尤其在面向AI推理的ASIC设计上具备优势。一季度45亿元的新增订单(据产业链信息)中,很大部分来源于国际客户在AI推理芯片上的设计需求,这验证了其技术能力已获得全球头部客户认可。
    2. IP授权:
      公司拥有包括GPU IP在内的丰富IP储备。推理芯片的多样化需求,使得其可复用的IP核成为客户快速开发芯片的关键,带来持续的知识产权收入。
  • 估值锚与催化窗口:

    • 当前价位:
      截至2026年4月21日收盘,股价为¥233.06。
    • 估值状态:
      当前PB为35.84。⚠️注意:高PB分位反映了市场对其平台型技术和成长性的溢价,但同时也意味着估值弹性较大,对订单落地进度和业绩兑现速度高度敏感。
    • 核心催化:5月初的季报后时期
      。市场将密切关注公司对一季度巨额订单的财务确认节奏、下游客户需求指引的更新,以及潜在的新订单公告。任何关于订单转化为收入的积极信号,都将成为股价的核心催化剂。
    • 研判建议:逢低分批布局,等待订单催化落地。
    • 关注条件:
      股价在近期调整中企稳(可观察是否在关键支撑位形成缩量整理),或出现放量突破短期下跌趋势线的信号。当前股价距年内高点回调约16%,已进入值得关注的区域。
  • 证伪条件与风险清单:

    1. 订单落地不及预期:
      一季度45亿新增订单若在后续季度未能顺利转化为收入,或新订单增速放缓,逻辑将被证伪。
    2. 技术迭代风险:
      AI芯片设计技术快速演进,若公司未能保持技术领先性,可能面临客户流失。
    3. 行业竞争加剧:
      更多设计公司涌入AI芯片服务领域,可能导致毛利率下滑。
    4. 估值高位波动:
      高PB状态下,市场风险偏好变化可能引发股价较大波动。

四、 其他值得观察的方向

  1. 高速互连芯片:澜起科技(688008.SH)
    。谷歌TPU定调CXL技术路线,公司作为全球MXC芯片龙头直接受益。需跟踪其向谷歌的送样认证进展及后续订单落地情况。
  2. 国产CPU:海光信息
    。深度绑定国内互联网大厂,其产品在推理服务器中有广泛应用。需关注其与下游客户在推理场景的联合优化成果及市场份额变化。
  3. 存储芯片:
    关注在DRAM/NAND涨价周期中产能有保障、具备长协订单锁定的国产存储厂商。伯恩斯坦情报显示的涨价超预期,可能带来板块性的业绩上修。
  4. AI基础设施:银轮股份(002126.SZ)
    。液冷业务订单规模(潜在50亿)远超市场当前预期,其从传统汽零向数字能源的转型逻辑正在兑现。关注其液冷订单的正式落地与产能建设情况。

五、 操作策略总结

  • 主攻方向:
    聚焦AI推理侧已获得订单验证的国产核心技术环节,首选芯原股份(688521.SH),逻辑在于订单驱动的业绩可见度。
  • 时间窗口:
    未来2周至5月初季报期是关键观察期,市场将重新评估各公司一季度订单与全年业绩指引的匹配度。
  • 风险应对:
    设定明确的止损条件。对于芯原股份,若股价放量跌破近期调整平台下沿,或公司在季报交流中对订单转化给出模糊或消极指引,则应考虑止损或减仓,等待逻辑更清晰的时点。

风险提示:以上分析基于公开的机构研报与产业链情报。AI产业发展迅速,技术路线存在不确定性;地缘政治因素可能影响供应链;个股估值较高,波动可能加大。投资者应结合自身风险承受能力独立决策。

认知差不差 · 每日投研深度

本文基于公开研报与市场数据整理分析,仅供学习参考。文中提及的任何标的均不构成投资建议。市场有风险,投资需谨慎。