摘要
本次会议聚焦 2026 年 AI 异构算力平台行业发展动向,指出随着大模型应用爆发式增长,异构算力加速渗透,市场规模有望从 2025 年的 330 亿元增至 2030 年的 1371 亿元,复合年增长率达 32.9%。报告从行业概览、产业分析、市场空间、发展趋势、典型企业五个维度展开,详解了异构算力的定义、主流芯片特性与组合模式、平台架构与协同体系,分析了产业链构成、国产芯片与软件生态现状、四类市场参与者的份额与优劣势、四种商业模式及行业采纳情况,明确需求井喷、国产替代、政策支持是行业核心驱动因素,存算一体化、云边端一体化是未来主要发展趋势,并介绍了阿里云灵骏智算和无问芯穹英菲尼 AI 平台两大代表性案例。
Q&A
Q:今天咱们重点聊2026年AI异构算力平台行业的发展,先说说核心观点是什么?
A:核心就是AI异构算力平台,是面向多元AI算力需求做的异构融合适配平台,靠统一协同管理各类异构算力释放整体效能。市场参与者分四类:云厂商、硬件芯片厂商、独立第三方厂商、系统集成商,其中云厂商占了约60%的份额。商业化这块,计时收费占50%,按算力收费20%,订阅收费15%,项目制收费10%。2025年中国AI异构算力平台市场规模330亿,预计2030年涨到1371亿,复合年增长率32.9%。现在不同品牌GPU混合部署已经是主流了,因为更适配高性能计算场景。
Q:先搞清楚基础概念,异构算力到底是什么?主流的AI芯片各有什么特点,适合什么场景?
A:异构算力就是在同一个计算系统里集成两种及以上不同类型或架构的计算单元,包括CPU、GPU、FPGA、ASIC这些,靠发挥不同硬件的优势,提升整体性能、能效比和灵活性。
具体到芯片,CPU是通用计算单元,逻辑控制和任务调度强,适合复杂串行任务和多样化负载,但并行能力有限。GPU有几千个计算核心,大规模并行计算厉害,是AI训练和推理的主流。FPGA是可编程硬件,能根据需求自定义硬件逻辑,性能在CPU和ASIC之间,延迟低。ASIC是专用集成电路,针对特定任务优化,性能最好但没灵活性。
放到大模型场景里,CPU管任务调度和逻辑控制,GPU做大规模并行训练,FPGA搞特定算法加速,ASIC适合高能效推理。
Q:现在异构算力有哪些常见的组合模式?各自适合什么场景?
A:现在单一架构已经满足不了需求了,异构算力普及率已经到85%。最主流的是两种:不同品牌GPU混合部署,还有CPU加GPU混合部署。
CPU加GPU是最常见的不同类型组合,刚好利用GPU的并行优势,特别适合大模型训练这种计算密集型任务。GPU加ASIC的组合,把GPU的并行和ASIC的高效结合起来,兼顾通用性、性价比和性能,是AI算力中心、视频处理这些场景的主流。GPU加FPGA的话,GPU扛高复杂度数据处理,FPGA按需硬件编程,灵活性高、延迟低,适合算法迭代快、对实时性要求高的场景。整体就是从单一架构往多元化、协同化走。
Q:那AI异构算力平台的准确定义是什么?它的架构分哪几层?
A:AI异构算力平台就是面向多元AI算力需求建的异构融合适配平台,能把硬件性能和计算要求对接上,让异构算力匹配用户需求,还能在节点间灵活调度,实现多元算力的智能运营和开放共享。核心就是统一协同管理各类异构算力,释放整体效能,给各种AI场景提供高性能、高可靠、高灵活的算力支撑。
架构主要分四层:第一层是硬件支撑平台,基于融合架构实现CPU、GPU这些硬件的虚拟化和池化。第二层是异构AI算力适配平台,是连接上层算法应用和底层硬件的核心,驱动软硬件算力工作,提供全流程适配服务。第三层是异构AI算力调度平台,负责算力在计算节点间的灵活调度,保证高性能和高扩展性。第四层是智能运营开放平台,提供软硬一体的融合方案,给全行业建开放共享的算力支撑体系和开发环境。
Q:经常听到异构算力协同,这个到底是怎么回事?核心包括哪几个方面?
A:异构算力协同是AI异构算力平台核心能力落地的关键,就是要打破不同异构算力生态之间的壁垒。完整的协同体系主要包括四个统一:统一计算、统一通信、统一调度、统一评测。
通过这四个统一,能实现不同架构芯片的算力无感知调用、通信无障碍互通、资源无闲置调度、性能无差异评测,解决硬件差异带来的适配难、调度难、利用率低这些问题。
具体来说,统一计算是基础,解决异构芯片生态割裂导致的算力碎片化,建底层硬件的统一抽象模型。统一通信是必要功能,打破硬件间的协议壁垒,解决数据孤岛。统一调度是智能决策中枢,解决多任务抢资源导致的效率下降。统一评测是衡量综合能力的手段,解决算力度量标准不一致没法全面对比的问题。
Q:AI异构算力平台和传统单一算力平台、云计算、边缘计算这些比,优势在哪?
A:对比下来优势挺明显的。计算框架上,它支持多种硬件动态分配,传统单一算力平台只能支持一种。调度能力上,它有异构芯片的智能化动态调度能力。延迟方面,能做到中等延迟,结合边缘计算还能实现低延迟。性能和成本上,性能高,成本适中。扩展性上,弹性很高,支持算力按需扩缩容。能效也高,符合绿色计算的趋势。
整体就是,计算架构能兼容多元化硬件,满足不同任务;智能化调度让资源最优利用;云边协同兼顾大规模计算和低延迟;还能平衡性能和经济性。
Q:AI异构算力平台的产业链是怎么构成的?上中下游都有哪些代表企业?
A:产业链挺完整的。上游是芯片厂商和服务器封装等硬件厂商,芯片这块有华为升腾、寒武纪、海光信息、摩尔线程这些。中游就是AI异构算力平台本身,参与者分几类:云厂商和科研院所,比如阿里云、百度智能云、上海人工智能实验室、智源研究院;硬件芯片厂商,比如华为升腾;独立第三方算力厂商,比如无问芯穹、青宝智能、宁静云;还有系统集成商,比如浪潮信息、中科曙光。下游应用覆盖特别广,互联网、金融、科技、政务、能源、制造、医疗、健康教育这些行业都有。
Q:现在国产AI芯片发展到什么水平了?有哪些关键的突破和数据?
A:国产AI芯片现在迎来了历史性突破,产能释放很明显,高端产品进入规模化商用,性能和海外的差距在缩小,自主可控能力也提升了。
性能上,高端AI训练芯片的算力已经接近英伟达A100,推理芯片的性能能达到或者超过英伟达H10。功耗上,通过优化架构,比海外同类产品低20%到30%。成本上,生产成本低30%到40%,性价比优势很明显。
量产规模这块,至少九家中国AI芯片公司的出货量或者订单量超过1万卡。比如华为升腾2025年出货量预估70万片,寒武纪2025年智能芯片及板卡生产量约12.8万片,同比增长超400%。2026年初,华为升腾910B已经大规模量产,还发布了搭载升腾950PR处理器的x less 350 AI训练推理加速卡,单卡性能是英伟达H20的2.87倍。
产业格局是龙头引领、多点开花,中芯国际7纳米工艺良率已经突破90%,清微智能的可重构AI芯片累计出货超3000万颗。
Q:那国产AI芯片的软件生态现在怎么样?各家企业的表现如何?
A:和英伟达比,国产的软件生态完善度还是有限的。现在的发展思路是,不牺牲自研指令集和硬件架构的创新空间,尽量在API设计和工具链形态上补齐,贴合用户的使用习惯,降低迁移门槛。
整体来看,华为升腾的CANN平台支持主流Linux发行版和容器镜像,覆盖常见Transformer等模型的主流算子和分布式通信路径,整体能对标NVIDIA的CUDA+cuDNN组合。摩尔线程以兼容CUDA开发体验为目标,现有的C++或者CUDA扩展改一点就能迁移到MUSA平台。寒武纪在推理场景的成熟度比较高,训练侧的生态相对有限。沐曦股份的MXMAC平台同时覆盖通用计算和AI训练推理。海光信息用GPU类通用加速器架构,支持CPU+DCU异构部署。
再细一点说,沐曦的平台已经覆盖主流训练和推理算子,但文档完备度和长尾算子支持不够。海光的话,现有的HIP或者ROCM应用改一点就能迁移,但面向大模型训练的专用算子库和高阶性能调优工具还不多。壁仞科技是深度合作加厂商支持的模式,API细节和算子覆盖度的公开资料比较少。燧原科技围绕云端推理场景做了很深的纵向优化,公开资料更聚焦接口细节。天数智芯围绕DIET软件生态建通用TPU平台,重点发力AI推理和行业应用落地。总的来说,国产软件生态正在从可用向好用迈进,但和英伟达成熟的生态比还有明显差距。
Q:整个异构算力市场的规模和国产化率未来会怎么变?
A:2025年中国异构算力市场规模是450亿元,同比增长23.3%,增长势头很强。随着AI云计算、大数据和计算中心建设的推进,行业对多元化、高效率算力的需求一直在涨,预计到2030年中国异构算力市场规模会超过1500亿元,2025到2030年的复合年增长率是27.3%,整个市场进入高速增长通道。
国产化率这块,现在国产AI芯片在制程、性能、规模化落地上都有结构性突破,软件生态也在完善,预计到2030年异构算力的国产化率会提升到45%左右。
Q:AI异构算力平台的四类市场参与者,各自的市场份额是多少?优劣势分别是什么?
A:市场份额方面,云厂商占约60%,芯片厂商占约25%,独立第三方厂商占约15%,系统集成商占约5%。
云厂商的优势是规模化稳定、弹性调度能力强、全栈产品化和企业服务成熟,劣势是成本偏高,还有客户会有数据上云的顾虑。科研院所的平台技术前沿性强,聚焦超大规模训练,和国产芯片适配深,但商业化成熟度低,运维和稳定性不够。芯片厂商的优势是硬软全栈协同优化、自主可控、供应链安全,劣势是生产成熟度不足,模型迁移成本高。独立第三方厂商的平台中立开放,异构芯片兼容度和调度利用率特别高,轻量化部署灵活,成本也更优,劣势是品牌和规模效应不足,服务覆盖有限。系统集成商在高密度硬件工程、大规模计算集群交付、本地化定制和国产芯片落地上经验丰富,但软件层的异构调度和模型优化能力偏弱,云化弹性不足,项目制交付周期长、成本高。
Q:现在AI异构算力平台的商业模式有哪几种?各自占比多少?适合什么客户?
A:有四种主要的收费模式。第一种是计时收费,按使用时长算,从客户成功购入AI资源的时刻开始计费,账单是节点规格单价乘以购买数量再乘以使用时长,适合短期测试,占约50%的市场份额。第二种是按算力收费,根据芯片性能强弱划分算力单位,再结合卡数和集群规模计价,性能越强、规模越大收费越高,大规模采购有阶梯折扣,适合长期性的模型服务,占约20%。第三种是订阅收费,针对整机集群包年、包月、包季,适合对算力有长期稳定需求的客户,灵活性高,占约15%。第四种是项目制收费,根据客户对硬件、网络、模型、安全部署、环境这些专属需求,单独做服务方案,包括开发、适配、运维,按项目整体收费,适合大型企业、政企和智算中心,占约10%。
Q:目前各行业对AI异构算力平台的采纳情况怎么样?部署模式有什么特点?
A:随着多模态成标配、智能体技术落地,企业对异构算力的需求一直在涨。采纳率这块,金融、政务、教育三大行业都超过了40%,处于领先水平。制造和医疗行业的部署渗透率也突破了30%,正在快速普及。
部署模式上,绝大多数企业都倾向于用成熟的第三方AI异构算力平台,这样能降低技术门槛,缩短建设周期,还能提升资源利用效率。只有政务、金融、制造这些对数据安全和自主可控要求特别高的行业,有部分头部企业会选择自主研发算力管理平台,实现定制化部署和精细化管控。整体来看,各行业的接受度和部署意愿都在持续提升。
Q:AI异构算力平台本身的市场规模和增速是多少?未来能到多大?
A:2025年中国AI异构算力平台市场规模是330亿元,同比增长32.0%。预计到2030年,市场规模有望超过1371亿元,2025到2030年的复合年增长率是32.9%。
需求端现在有个很明显的趋势,因为GPU更适配AI大模型这些高性能计算场景,不同品牌GPU混合部署已经成了主流,占比达到45%,说明市场已经从CPU主导或者CPU加GPU主导,走向了GPU主导阶段。2025年全球新建的数据中心里,72%采用了GPU主导架构,其中超大规模数据中心的GPU部署率达到了91%,机构算力平台已经成了AI基础设施的核心。
Q:推动这个行业发展的核心驱动因素有哪些?先说说需求端的情况?
A:第一个核心驱动就是需求。一方面,AI算力需求井喷,加上各行业多样化的应用场景,让算力异构化成了必然趋势。现在大模型参数从十亿级涨到了万亿级,算力需求是超摩尔定律增长的,全球AI算力需求每3到4个月就翻一番。再加上各行业应用落地和绿色计算的要求,单一架构的算力已经没法做到能效最优了。
另一方面,大模型应用从训练阶段全面转向规模化推理,推理算力需求迎来了井喷,预计2026年全球推理算力规模在智能算力中的占比会提升到75%以上,覆盖AIGC、智能体、行业模型微调这些主流场景。异构算力平台刚好能通过专用芯片选型、动态调度优化,满足推理业务对低延迟、高吞吐的核心诉求,还能显著降低成本。有实测案例显示,英伟达加国产算力的异构协同推理方案,让DeepSeek 671B大模型在多场景下的集群总吞吐提升了30%到72%,并发能力提升2倍,同等吞吐标准下,推理成本最高能下降42%。
Q:国产替代在这个行业里扮演什么角色?现在国产化率到多少了?
A:国产替代是第二个核心驱动因素。现在以升腾、寒武纪、海光信息、昆仑芯为代表的国产AI芯片厂商,单卡性能一直在追赶英伟达,同时通过兼容CUDA生态和自研生态两种路径布局产业生态。比如华为升腾910C芯片的FP16稠密算力约800TFLOPS,接近英伟达H100算力的80%;寒武纪MLU590芯片性能能对标英伟达A100。2025年升腾910系列芯片的出货量从50.7万片提升到了80.5万片,平头哥芯片累计交付量突破47万片,目前国产AI芯片累计销量已经超过2.5万卡。
再加上美国对高性能AI芯片出口管制收紧的外部因素,中国AI芯片的国产化率从2023年的15%上升到了2025年的41%。不过也要看到,国产芯片在极致单卡性能、生态成熟度、大模型适配优化这些细节上,和英伟达顶级产品还有差距。这种情况下,兼容国产和海外的异构算力就成了市场的核心需求。AI异构算力平台靠跨芯片适配和统一调度能力,能同时适配英伟达、AMD这些海外芯片,还有华为升腾、寒武纪这些全系列国产芯片,打通异构集群的协同壁垒,成了衔接国产替代和算力刚需的关键纽带。比如上海AI实验室的DeepLink混推方案,首次实现了多款国产芯片的深度混合调度和协同推理;无问芯穹的英频尼AI平台支持英伟达、AMD、华为升腾、海光、寒武纪等十余种计算卡。
Q:政策层面给了哪些支持?有哪些关键的政策文件?
A:政策是第三个核心驱动因素。近年来国家一直在大力推进异构算力调度、算力并网这些关键技术研发,还有算力互联互通体系建设。
2023年10月,工信部等六部门发布《算力基础设施高质量发展行动计划》,探索建设多层级算力调度平台。2023年12月,发改委等部门发布《关于深入实施东数西算工程加快构建全国一体化算力网的实施意见》,促进多元异构算力融合发展。2024年5月,网信办等三部门发布《信息化标准建设行动计划》,推进异构算力中心的共性标准研究。2025年5月,工信部发布《算力互联互通行动计划》,提出到2026年建立较为完备的算力互联互通标准体系。2025年8月,国务院发布《关于深入实施人工智能+行动的意见》,强化智能算力统筹。2026年1月,工信部发布《关于开展国家算力互联互通节点建设工作的通知》,建设算力供需对接体系。2026年3月,国务院政府工作报告提出实施超大规模计算、集群算力协同等新基建工程。这些政策都给行业发展提供了坚实的制度保障。
Q:未来行业有哪些主要的发展趋势?先说说存算一体化这个方向?
A:第一个大趋势就是存算一体化。传统的冯诺依曼架构有存储墙、功耗墙的问题,已经满足不了AI算力的需求了。现在行业正在通过五大维度的创新,实现存算一体化的架构范式转变。和传统架构比,存算一体架构的能耗占比能下降50%。
具体的创新维度包括:技术路线创新,通过先进封装把计算和存储芯片紧密集成,或者直接利用存储单元的物理特性进行计算;器件与介质创新,比如FRAM适合大算力,Flash适合低功耗,端侧推理用的RRAM、MRAM这些新型存储器,兼具高速、高密度、非易失性的特点;计算模式创新,数字存算精度高,模拟存算能效极高;系统级创新,用Chiplet或者3D堆叠把存算单元和其他功能单元集成;还有软件工具链成熟化,开发专用的编译器。存算一体化已经成了突破算力瓶颈的重要技术方向。
Q:云边端一体化为什么会成为趋势?现在面临哪些瓶颈?
A:第二个大趋势是云边端一体化。2026年,教育、政务两大行业的智能体使用率已经突破了80%,制造、金融、流通业的智能体渗透率也超过了60%,智能体已经成了企业的核心生产工具。智能体的自主推理、跨系统协同执行能力,让算力需求从脉冲式消耗变成了持续性爆发。但传统的集中式算力架构,已经适配不了智能体多元场景对低时延、高并发和数据隐私的严格要求,所以必须构建云、边、端一体化的全域协同算力基础设施。
具体分工是,云端处理非实时的大数据分析和模型训练,边缘节点承接低时延、高并发的实时推理任务,终端设备完成数据采集和及时响应。
现在云边协同的主要瓶颈,数据流传输与管理占47%,跨平台开发成本高、多芯片适配难占28%,云边端算力割裂造成的性能衰减占17%,模型压缩损耗占8%。未来低成本实现多芯片适配,破解边缘算力碎片化和孤岛问题,会是云边端算力全域协同的核心突破方向。
Q:最后介绍几家典型的企业吧,先说说阿里云的灵骏智算服务?
A:阿里云的灵骏智算服务,产品架构分好几层。基础设施层采用CUBA云原生架构,提供GPU虚拟化、EGPU计算通信和网络优化、ACCL数据加载优化、高速缓存等能力。智能计算工程平台,提供交互式开发、分布式训练、模型推理服务、科学计算服务这些。还有智能计算资产管理,负责模型管理、代码管理、数据管理、镜像管理、资源组管理。运维层提供硬件资源监控、任务告警、安全等服务。应用场景覆盖AIGC、自动驾驶、金融量化、科研管理这些领域。
它的主要优势是全链路性能提速,计算密集型项目的迭代效率能提升两倍以上;高效的池化异构算力调度技术,资源利用率能提升三倍;能轻松应对大模型和大规模工程仿真的算力需求;还能简化异构算力的分配管理,持续监控和优化。
Q:那无问芯穹的英菲尼AI平台有什么核心优势?
A:无问芯穹的英菲尼AI平台采用M×N AI基础设施架构,能连接多种大模型和多元芯片。平台架构包括:基础设施层,支持国产芯片和进口芯片,采用IB或者RoCE网络和高性能存储;计算平台层,包括万卡异构集群大模型、M×N多元芯片框架、无穷云平台、无穷模型服务平台等;模型层,包括基座模型、多专家模型等;应用产品层,包括LLM应用开发平台、行业AI应用等。
它的核心优势,首先是通过异构算力适配技术,实现了单任务千卡规模的异构算力混合训练,集群资源利用率平均能达到90%。然后提供一站式的AI开发平台和大模型服务平台,覆盖从数据托管、代码开发、模型训练、模型部署到推理服务的全生命周期。还有就是支持无感迁移,兼容多种编程语言和框架,包括沐曦的MXMAC、英伟达的CUDA、天数智芯的MTQ、摩尔线程的MUSA、燧原的SUPA、算能的TOPS Rider、寒武纪的BANG等,能实现万卡异构集群的高效协同。
#AI算力 #异构算力 #AI异构算力平台 #国产AI芯片 #华为升腾 #寒武纪 #海光信息 #摩尔线程 #阿里云 #调研纪要
免责声明:市场有风险,投资需谨慎。本文内容仅代表调研观点,不代表本公众号立场。
——END——
本期内容分享完毕。后续将持续更新行业分析、调研纪要、外资研报与市场复盘内容。
感兴趣的朋友,可自行参考文末体验通道。

夜雨聆风