AI产业链与AI公司业务划分:一篇通俗易懂的文献综述

编者按

在围绕 AI 企业展开一些研究时，最先遇到的就是一个很基础的问题：什么样的公司可以被称为 AI 企业？一家企业卖芯片、建智算中心、开发大模型、做智能客服、生产机器人，是否都可以放在同一个研究对象里？如果可以，它们之间又应该如何区分？对经济管理研究者来说，理解 AI 企业不能只停留在概念板块、热门词汇或公司宣传上。我们至少需要知道 AI 产业链中有哪些基本环节，也需要理解基础层、技术层和应用层之间的关系。只有把这些最基础的产业知识理清楚，后续讨论企业边界、商业模式、创新效率、跨层布局和产业链协同，才有比较可靠的起点。

基于这个想法，我和 Codex 共同完成了这篇推文。文章尽量用面向初学者的方式解释 AI 产业链：先说明常见术语，再梳理基础层、技术层和应用层的划分，最后结合一些现实企业案例，帮助读者理解不同 AI 公司究竟在产业链中扮演什么角色。请注意这当然不是一篇严格意义上的学术论文，更像是后续研究的知识基础梳理。

摘要：人工智能公司看起来都在做“AI”，实际处在产业链中的位置并不相同。有的企业提供芯片、服务器、数据中心、云平台和PCB等硬件配套，解决模型训练与推理所需的算力基础；有的企业开发算法、基础模型、机器学习框架和工具平台，形成可复用的技术能力；还有大量企业把AI嵌入制造、医疗、金融、交通、教育、客服、机器人等场景，通过行业应用实现商业价值。本文构建“基础层—技术层—应用层”的三层产业链框架，并面向零基础读者补充GPU、NPU、PCB、服务器、云计算、智算中心、训练、推理、API、MLOps等常见概念解释，结合英伟达、微软、OpenAI、百度、科大讯飞、海康威视、寒武纪、商汤、优必选等企业案例，说明AI公司业务边界为什么会交叉、如何理解跨层布局及其机会和风险。

P1：问题提出

过去几年，公众对AI公司的印象经历了明显变化。早期谈到AI企业，人们常想到人脸识别、语音识别、智能客服或自动驾驶算法。生成式AI兴起后，大模型、算力集群、云平台、AI芯片、智能体和行业解决方案同时进入讨论范围。于是一个常见疑问出现了：同样被称为AI公司，英伟达、OpenAI、微软、百度、科大讯飞、寒武纪、商汤、海康威视和优必选到底有什么不同？回答这个问题，需要把AI公司放回产业链中观察。一个可运行、可部署、可商业化的AI系统，通常需要算力、芯片、PCB、服务器、数据中心、云服务、算法模型、工程平台、数据治理、应用场景和组织流程共同配合。Porter（1985）的价值链理论提醒我们，企业竞争优势来自多个活动之间的组合；Teece（1986）关于互补性资产的讨论进一步说明，技术只有进入制造、渠道、数据、客户关系和生态伙伴网络之后，才更容易转化为持续收益。本文将AI产业链概括为基础层、技术层和应用层三个层级。基础层解决“AI跑得动”的问题，技术层解决“AI学得会、可复用”的问题，应用层解决“AI用得上、能创造价值”的问题。三层划分并不意味着企业只能属于其中一层。许多头部企业会向上下游延伸，例如微软既提供云计算和模型服务，也把AI嵌入办公软件；百度既研发大模型，也经营云服务和智能驾驶、智能搜索等应用；英伟达从芯片扩展到软件栈和开发者生态。

P2：先读懂这些词再看文章

AI产业链里有很多缩写和硬件名词，如果不先解释清楚，后面的产业划分会很难读。下面这些词不需要背定义，只要先建立直观理解：基础层像“水电煤和厂房”，技术层像“机器和工艺”，应用层像“把机器放到餐厅、医院、工厂里真正干活”。

GPU：图形处理器，最初主要用于图像和游戏计算。它擅长同时做大量重复计算，所以很适合训练和运行AI大模型。英伟达的核心产品就是GPU。

NPU/AI芯片：专门为AI计算设计的芯片。NPU常见于手机、汽车和边缘设备，AI芯片也可以用于服务器和数据中心。它们的目标是让AI计算更快、更省电。

PCB：印刷电路板，可以理解为电子设备里的“线路底板”。芯片、显存、电源元件等都要装在PCB上并通过线路连接。AI服务器和加速卡需要高性能PCB支撑高速信号传输。

服务器：为很多用户或程序提供计算服务的高性能电脑。AI服务器通常装有多块GPU或AI加速卡，用来训练大模型或处理大量用户请求。

数据中心/智算中心：集中放置大量服务器的机房。数据中心偏通用计算，智算中心更强调面向AI训练和推理的算力集群，还涉及电力、网络、冷却和运维。

云计算：把服务器、存储和软件能力通过网络租给用户。企业不用自己建机房，也可以按需使用算力。微软Azure、阿里云、腾讯云、百度智能云都属于云平台。

API：应用程序接口，可以理解为软件之间的“插座”。企业通过API调用大模型能力，把问答、写作、识别等功能接入自己的产品。

MLOps：机器学习运维，指把模型从实验室推到真实业务中运行的一套流程，包括部署、监控、更新、评测和故障处理。

边缘计算：把计算放在离用户或设备更近的地方，比如摄像头、汽车、工厂设备，而不是全部传回云端。好处是响应快、隐私风险较低。

液冷散热：用液体帮助服务器降温。AI服务器功耗高、发热大，散热能力会影响数据中心能否稳定运行。

CUDA ：英伟达的软件开发平台。很多AI程序依赖CUDA调用GPU能力，这也是英伟达不仅卖硬件、还拥有软件生态优势的重要原因。

知识图谱：把人物、公司、产品、疾病、地点等实体及其关系整理成网络，帮助AI理解“谁和谁有什么关系”。

智能体：能够理解任务、调用工具、分步骤完成工作的AI系统。它不只是聊天，还可能检索资料、写代码、操作软件或生成报告。

P3：文献如何理解AI产业链

现有研究很少只用“AI产业链”这一标题展开讨论，但价值链、通用目的技术、数字平台、创新生态系统和数据网络效应等文献，为理解AI产业提供了互补视角。价值链文献帮助我们看清AI价值从哪里产生，通用目的技术文献解释AI为什么会扩散到许多行业，平台与生态系统文献说明企业为什么经常跨边界合作，数据网络效应研究则指出应用场景会反过来塑造算法和模型能力。把这些文献合在一起看，AI产业链就不只是从上游到下游的线性流程，更像由基础设施、模型能力、数据反馈和行业应用共同构成的动态系统。

（一）从价值链到AI价值链

价值链理论提供了理解产业分工的起点。Porter（1985）把企业价值创造分解为研发、生产、营销、服务等一系列活动，强调不同活动之间的衔接会影响竞争优势。放到AI产业中，价值链可以帮助我们区分“谁在提供底层资源”“谁在开发通用技术”“谁在把技术卖给行业客户”。例如，芯片和数据中心企业承担资源供给，模型公司承担能力生成，行业解决方案公司则把算法嵌入真实业务流程。这个视角的好处在于清晰直观，读者可以沿着价值创造过程理解AI公司之间的差异。

AI价值链显然比传统制造业价值链复杂。传统产业链往往强调原材料、生产、销售和服务的顺序，AI产业中的数据、模型和场景会不断循环。一个智能客服系统在服务用户时会积累对话数据，数据经过清洗和标注后又可能改进模型；一个工业视觉系统在工厂部署后会遇到新的缺陷类型，这些现场样本会反过来推动算法优化。Attard-Frost and Widder（2025）讨论AI value chain时，关注的不只是技术供给，还包括价值分配、劳动、数据来源、平台控制和治理责任。

近年关于Big AI的研究进一步强调基础设施的重要性。van der Vlist et al.（2024）指出，生成式AI的产业化越来越依赖云基础设施和大型科技公司的平台能力。Stanford HAI（2025）的AI Index报告也显示，AI投资、模型训练成本、算力需求和企业采用率正在同步上升。对于普通读者来说，这解释了为什么英伟达、云厂商、智算中心、PCB和散热供应商会在生成式AI浪潮中变得关键：它们提供了大模型真正运行起来所需的底座。

（二）通用目的技术与基础模型

从技术经济学看，AI具有通用目的技术的典型特征。Bresnahan and Trajtenberg（1995）认为，通用目的技术通常具备广泛适用性、持续改进潜力和创新互补性。电力、计算机和互联网都曾表现出这种特征：它们进入许多行业，并且需要企业调整设备、流程、组织和商业模式，才能释放生产率。Brynjolfsson et al.（2019）讨论AI生产率悖论时也指出，新技术的经济效果常常滞后出现，因为组织还需要补足数据、流程、人才和管理制度。

生成式AI让通用目的技术的特征更加直观。Bommasani et al.（2021）提出“基础模型”概念，强调大规模预训练模型可以迁移到多种下游任务。这里的“预训练”可以理解为先让模型读大量文本、图片或代码，形成通用能力，再根据具体场景微调。Feuerriegel et al.（2024）系统讨论生成式AI对企业流程、知识工作和商业模式的影响。与过去面向单一任务训练的小模型相比，基础模型更像一套可复用的能力底座，可以用于问答、翻译、写作、编程、检索、图像理解和流程自动化。

DeepSeek-AI（2025）关于推理模型的研究进一步说明，模型能力的扩散方式也在变化。开源模型、蒸馏模型和强化学习路线降低了部分企业接入先进模型能力的门槛，也让产业竞争从“谁能训练最大模型”扩展到“谁能更高效地部署、微调、评测和应用模型”。这对三层产业链的理解有直接影响：基础层需要支撑更低成本的训练和推理，技术层需要沉淀更稳定的模型服务，应用层则要把模型能力翻译成具体工作流中的效率提升。

（三）数字平台、生态系统与数据反馈

AI产业链还需要平台和生态系统视角。Yoo et al.（2010）指出，数字技术具有层级模块化架构，创新常发生在设备、网络、服务和内容之间的重新组合。Bharadwaj et al.（2013）认为，数字业务战略已经把技术基础设施、业务流程和组织边界连接在一起。Nambisan et al.（2017）进一步把数字创新理解为分布式、开放式和跨边界的过程。这些研究解释了AI公司为什么经常难以用单一产品标签描述：模型要通过云平台交付，应用要接入企业系统，硬件要依赖软件生态，行业客户还会参与需求定义和数据反馈。

生态系统研究则帮助我们理解跨层合作。Adner（2017）强调生态系统围绕价值主张形成多边伙伴结构，Jacobides et al.（2018）关注模块互补和非完全层级控制关系。AI产业中的芯片、PCB、服务器、云平台、模型平台、数据服务商、开源社区、应用开发者和行业客户共同组成生态系统。比如OpenAI的模型能力需要微软Azure等基础设施支持，英伟达的GPU价值也依赖CUDA、开发者工具、模型厂商需求和数据中心客户共同放大。

数据反馈是AI产业链区别于传统价值链的核心特征。Gregory et al.（2021）讨论AI与数据网络效应如何共同创造用户价值：用户交互越多，数据越丰富，算法和产品改进空间越大，产品体验提升后又会吸引更多用户。应用层因此不只是技术层的销售出口。医疗影像、工业质检、智能客服、自动驾驶和教育学习系统中的真实场景数据，都会反向影响模型优化、产品设计和商业模式。

P4：AI产业链的三层划分

（一）基础层：算力、芯片、PCB与数据基础设施

基础层是AI产业的资源底座，可以理解为让AI“有机器可用、有电可跑、有地方可放”。它不仅包括AI芯片和服务器，也包括PCB、存储、电源、连接器、网络设备、数据中心、电力和散热。PCB容易被忽视，但它是芯片和各种电子元件连接的线路板。AI服务器内部要传输大量高速信号，对PCB材料、层数、散热和可靠性要求更高，所以PCB、连接器、散热等环节也会受到AI需求拉动。

基础层里最常被提到的是GPU。GPU可以先理解为一种特别擅长并行计算的芯片。AI模型训练时要同时处理大量矩阵计算，GPU比普通CPU更适合这类任务。NPU或AI加速芯片则更强调为AI任务专门设计，常用于手机、汽车、边缘设备或服务器。服务器是装载这些芯片的高性能电脑，数据中心和智算中心则是集中放置大量服务器的机房和算力集群。云计算把这些资源包装成可以按需租用的服务，企业不用自己买机器，也能使用大规模算力。

从企业案例看，英伟达是基础层最典型的全球企业。它的价值不只来自GPU硬件本身，还来自CUDA软件生态、开发者社区、数据中心产品和与云厂商、模型公司的深度绑定。国内企业中，寒武纪更接近AI芯片和智能计算硬件逻辑，浪潮信息、曙光数创等企业与服务器、智算中心或数据中心基础设施关系更密切，沪电股份、生益科技等PCB或材料企业则属于更上游的硬件配套环节。基础层企业通常离普通消费者较远，却决定AI能力能否以足够低的成本、足够稳定的方式交付给下游。

基础层的商业特点是投入大、门槛高、周期长。芯片设计需要长期研发和供应链协同，数据中心建设需要资本开支、电力资源和运维能力，云平台还需要规模经济和客户生态。基础层一旦形成优势，可能带来较强的议价能力和产业控制力；同时也会承受技术路线变化、供应链波动、资本开支压力和政策监管风险。理解这一层，可以帮助读者看清“GPU涨价”“PCB订单增长”“智算中心建设”“液冷散热需求上升”等新闻为什么会影响整个AI产业。

（二）技术层：算法、模型与平台能力

技术层是AI产业中最容易被公众直接感知的一层，主要包括算法模型、机器学习框架、计算机视觉、语音识别、自然语言处理、大模型、知识图谱、MLOps和模型开发平台。算法可以理解为机器解决问题的方法，模型则是算法在大量数据中学习后形成的能力。计算机视觉让机器“看懂”图片和视频，语音识别让机器“听懂”声音，自然语言处理让机器处理文字，大模型则把这些能力做得更通用、更可迁移。

技术层的关键不只是“模型参数有多大”或“榜单分数有多高”。一个模型要变成产业能力，还需要API服务、模型安全、工程部署、评测体系、开发者文档、插件机制、智能体框架和企业级权限管理。API可以理解为软件之间的插座，企业通过API把大模型接进自己的产品；MLOps则是模型上线后的运维体系，负责监控模型表现、更新版本、处理故障和保证稳定运行。

技术层内部也有分工。一部分企业训练基础模型，如OpenAI、Anthropic、Google DeepMind、DeepSeek、智谱AI、月之暗面、MiniMax等；一部分企业提供模型服务、开发平台和私有化部署，如微软、百度、阿里云、腾讯云等；还有企业围绕数据标注、向量数据库、知识库、模型评测、安全合规和智能体开发提供支撑。生成式AI之后，技术层的边界更加平台化：模型能力会被办公软件、搜索、编程工具、设计工具、企业知识库和智能体应用反复调用。

理解技术层，还需要注意模型能力和可商业化能力之间的距离。研究论文中的模型效果代表技术潜力，稳定服务企业客户则需要成本控制、响应速度、隐私保护、合规审查和持续迭代。很多模型公司会面临一个共同挑战：用户增长会带来更高推理成本，开源模型会压低基础能力的价格，行业客户又要求高度定制。技术层企业要形成长期优势，需要把模型能力转化为平台能力、生态能力和行业交付能力。

（三）应用层：行业场景与商业化转化

应用层是AI技术进入具体行业的环节。对于大多数企业客户来说，他们购买的是能解决具体问题的产品：降低质检误判率、提升客服效率、辅助医生阅片、优化供应链排产、提高营销转化率、帮助员工处理文档和代码。应用层最接近收入和客户，也最能检验AI技术是否真正产生价值。

应用层可以进一步分为行业解决方案、AI产品和终端设备、运营与数据反馈三类。行业解决方案面向制造、医疗、金融、安防、交通、教育、政务等客户，往往需要定制化交付；AI产品和终端设备面向普通用户或企业员工，例如智能客服、办公助手、编程助手、智能驾驶、机器人、AI手机、AI PC和智能摄像头；运营与数据反馈负责把用户使用过程中的数据、问题和需求反馈给模型和产品团队。

企业案例能让这一层更容易理解。科大讯飞长期深耕语音、教育、办公和汽车场景，其价值来自语音识别、自然语言处理和行业产品的结合。海康威视把计算机视觉、物联网设备和行业解决方案结合，典型场景包括安防、园区、交通和城市治理。商汤科技从视觉算法拓展到智慧商业、智慧城市、智能汽车和AIGC。优必选把AI能力与机器人硬件、运动控制和行业服务结合，体现AI与实体设备、现场部署之间的关系。应用层最接近商业化，也最容易出现概念混淆。很多公司会在年报或宣传中使用“智能”“AI+”“大模型赋能”等表达，实际业务可能只是把第三方模型或算法嵌入原有产品。判断应用层企业时，应关注AI是否真正改变产品功能、成本结构、用户体验或数据反馈。例如，一个客服系统只是接入通用聊天机器人，和一个能够接入企业知识库、识别客户意图、自动生成工单并持续优化服务流程的系统，在商业价值上有明显差异。

P5：如何划分AI公司业务：跨层

多元化与单层专注的现实含义

（一）先看企业在产业链中解决什么问题

理解一家AI公司，第一步不是看它是否使用“AI”标签，而是看它主要解决产业链中的哪类问题。基础层企业解决“AI如何跑起来”的问题，典型业务包括芯片、PCB、服务器、数据中心、云计算、液冷散热和网络连接；技术层企业解决“AI如何变聪明、可调用、可部署”的问题，典型业务包括算法、基础模型、大模型、MLOps、模型API、知识图谱和开发者平台；应用层企业解决“AI如何进入真实场景并产生收入”的问题，典型业务包括智能制造、智慧医疗、智慧金融、智能安防、AI办公、智能客服、智能驾驶、机器人和内容生成工具。实际划分时，可以依次看五类证据：第一，主营业务收入主要来自哪里；第二，公司掌握的是硬件底座、模型算法，还是行业解决方案；第三，研发项目和专利名称集中在哪一类技术；第四，客户购买的是算力、模型能力，还是具体产品；第五，应用场景是否能形成持续数据反馈。概念板块只能帮助发现候选企业，不能直接等同于AI企业。对于上市公司研究，更稳妥的做法是结合年报中的主营业务、核心技术、主要产品、研发项目和专利方向进行核验。

（二）跨层多元化：协同更强，管理也更难

很多AI企业不会只停留在一个层次。英伟达是最典型的例子。它的核心收入和竞争优势来自GPU、数据中心产品和高速互联，位置明显偏基础层；但CUDA、软件库、开发者社区和AI Enterprise等软件生态又把它延伸到技术层。英伟达并不直接经营大量行业应用，却通过基础层和技术层的深度绑定，成为全球AI产业链的关键平台型企业。这个例子说明，跨层并不一定意味着平均布局三个层次，也可能是以某一层为主轴，向相邻层延伸以强化主业护城河。字节跳动则更像技术层和应用层融合的企业。它依靠推荐算法、大模型、内容理解、多模态生成和广告系统形成技术能力，又通过抖音、TikTok、剪映、豆包、火山引擎和电商等场景实现应用落地。与英伟达相比，字节跳动在芯片和硬件基础层并不占主导，但它在技术层和应用层之间形成强反馈：用户行为和内容生态为算法迭代提供数据，算法和模型又提高内容分发、广告转化、创作效率和用户体验。

跨层多元化的好处在于，企业能够把算力、模型、数据和场景连接起来。科大讯飞既有语音识别、自然语言处理和大模型能力，也把这些技术用于教育、办公、汽车和医疗等场景；海康威视把计算机视觉、摄像头、物联网设备和行业解决方案结合，在安防、交通、园区和城市治理中形成应用闭环。对这类公司来说，跨层布局有助于提高技术商业化速度，也有助于通过场景数据反哺模型和产品。

但跨层多元化也不是越多越好。基础层需要重资产投入，技术层需要持续研发和高端人才，应用层需要销售、交付、客户服务和行业知识。如果企业同时铺开多个层级，却没有足够技术积累、资金能力和组织协调能力，就容易出现资源分散、项目过多、研发方向摇摆和商业化效率下降。现实中，一些公司在生成式AI热潮中快速贴上“大模型”“智能体”“AIGC”等标签，但缺乏稳定产品和收入，这类跨层表述更多是概念扩张，不能简单视为高质量多元化。

（三）单层专注：定位更清晰，但也可能受制于上下游

专注某一层次也有明显优势。寒武纪更接近基础层企业，业务主要围绕AI芯片和智能计算硬件展开。这样的企业定位清晰，研发资源集中，容易在特定技术环节形成深度积累。中际旭创、新易盛、光迅科技等光模块和通信设备企业也更接近AI基础设施的上游配套环节，它们未必直接开发大模型或行业应用，但在AI数据中心扩张中具有重要位置。

技术层专注企业的代表包括专注算法、模型、知识图谱、语音识别、计算机视觉或开发平台的公司。它们的优势在于技术复用性强，能够服务多个行业，理论上具有较好的规模扩张潜力。但如果缺乏应用场景和客户入口，技术层企业也可能面临商业化周期长、客户需求不明确、收入确认困难等问题。OpenAI早期更偏技术层，后来通过ChatGPT直接进入应用层，就是为了把模型能力转化为真实用户和商业收入。

应用层专注企业更接近客户和收入。例如蓝色光标、中文在线、视觉中国等公司更容易围绕内容生产、营销、版权素材和AIGC应用形成产品；金山办公把AI嵌入办公软件，提升文档处理、写作、表格和演示效率。应用层企业的优势是场景明确、客户需求具体、商业化路径短；不足在于，如果缺少自有模型、数据和底层技术，可能容易被上游模型平台替代，或者只能在同质化应用中竞争。

（四）用于研究时，可以把企业分成“主层级+跨层特征”

如果把这一框架用于实证研究，不建议把每家公司强行归入唯一类别。更合理的做法是先判断主层级，再记录其是否涉及其他层级。例如，英伟达可以被理解为“基础层主导，向技术层延伸”；科大讯飞可以被理解为“技术层主导，深度进入应用层”；海康威视可以被理解为“应用层主导，依托视觉技术和硬件设备”；寒武纪则更接近“基础层专注”。

需要强调的是，高多元化不必然代表更强竞争力，低多元化也不代表落后。高多元化企业可能获得跨层协同，但也更依赖组织管理、资金和生态协调能力；低多元化企业可能在某一环节做深做强，但也可能受制于上下游平台或客户场景。真正有解释力的问题是：企业的层级布局是否与其技术能力、资源条件和商业化路径匹配。

END

注：本文部分观点内容由AI生成，不代表本人意见。