编者按
在围绕 AI 企业展开一些研究时,最先遇到的就是一个很基础的问题:什么样的公司可以被称为 AI 企业?一家企业卖芯片、建智算中心、开发大模型、做智能客服、生产机器人,是否都可以放在同一个研究对象里?如果可以,它们之间又应该如何区分?对经济管理研究者来说,理解 AI 企业不能只停留在概念板块、热门词汇或公司宣传上。我们至少需要知道 AI 产业链中有哪些基本环节,也需要理解基础层、技术层和应用层之间的关系。只有把这些最基础的产业知识理清楚,后续讨论企业边界、商业模式、创新效率、跨层布局和产业链协同,才有比较可靠的起点。
基于这个想法,我和 Codex 共同完成了这篇推文。文章尽量用面向初学者的方式解释 AI 产业链:先说明常见术语,再梳理基础层、技术层和应用层的划分,最后结合一些现实企业案例,帮助读者理解不同 AI 公司究竟在产业链中扮演什么角色。请注意这当然不是一篇严格意义上的学术论文,更像是后续研究的知识基础梳理。

摘要:人工智能公司看起来都在做“AI”,实际处在产业链中的位置并不相同。有的企业提供芯片、服务器、数据中心、云平台和PCB等硬件配套,解决模型训练与推理所需的算力基础;有的企业开发算法、基础模型、机器学习框架和工具平台,形成可复用的技术能力;还有大量企业把AI嵌入制造、医疗、金融、交通、教育、客服、机器人等场景,通过行业应用实现商业价值。本文构建“基础层—技术层—应用层”的三层产业链框架,并面向零基础读者补充GPU、NPU、PCB、服务器、云计算、智算中心、训练、推理、API、MLOps等常见概念解释,结合英伟达、微软、OpenAI、百度、科大讯飞、海康威视、寒武纪、商汤、优必选等企业案例,说明AI公司业务边界为什么会交叉、如何理解跨层布局及其机会和风险。

P1:问题提出

过去几年,公众对AI公司的印象经历了明显变化。早期谈到AI企业,人们常想到人脸识别、语音识别、智能客服或自动驾驶算法。生成式AI兴起后,大模型、算力集群、云平台、AI芯片、智能体和行业解决方案同时进入讨论范围。于是一个常见疑问出现了:同样被称为AI公司,英伟达、OpenAI、微软、百度、科大讯飞、寒武纪、商汤、海康威视和优必选到底有什么不同?回答这个问题,需要把AI公司放回产业链中观察。一个可运行、可部署、可商业化的AI系统,通常需要算力、芯片、PCB、服务器、数据中心、云服务、算法模型、工程平台、数据治理、应用场景和组织流程共同配合。Porter(1985)的价值链理论提醒我们,企业竞争优势来自多个活动之间的组合;Teece(1986)关于互补性资产的讨论进一步说明,技术只有进入制造、渠道、数据、客户关系和生态伙伴网络之后,才更容易转化为持续收益。本文将AI产业链概括为基础层、技术层和应用层三个层级。基础层解决“AI跑得动”的问题,技术层解决“AI学得会、可复用”的问题,应用层解决“AI用得上、能创造价值”的问题。三层划分并不意味着企业只能属于其中一层。许多头部企业会向上下游延伸,例如微软既提供云计算和模型服务,也把AI嵌入办公软件;百度既研发大模型,也经营云服务和智能驾驶、智能搜索等应用;英伟达从芯片扩展到软件栈和开发者生态。

P2:先读懂这些词再看文章

AI产业链里有很多缩写和硬件名词,如果不先解释清楚,后面的产业划分会很难读。下面这些词不需要背定义,只要先建立直观理解:基础层像“水电煤和厂房”,技术层像“机器和工艺”,应用层像“把机器放到餐厅、医院、工厂里真正干活”。
GPU:图形处理器,最初主要用于图像和游戏计算。它擅长同时做大量重复计算,所以很适合训练和运行AI大模型。英伟达的核心产品就是GPU。
NPU/AI芯片:专门为AI计算设计的芯片。NPU常见于手机、汽车和边缘设备,AI芯片也可以用于服务器和数据中心。它们的目标是让AI计算更快、更省电。
PCB:印刷电路板,可以理解为电子设备里的“线路底板”。芯片、显存、电源元件等都要装在PCB上并通过线路连接。AI服务器和加速卡需要高性能PCB支撑高速信号传输。
服务器:为很多用户或程序提供计算服务的高性能电脑。AI服务器通常装有多块GPU或AI加速卡,用来训练大模型或处理大量用户请求。
数据中心/智算中心:集中放置大量服务器的机房。数据中心偏通用计算,智算中心更强调面向AI训练和推理的算力集群,还涉及电力、网络、冷却和运维。
云计算:把服务器、存储和软件能力通过网络租给用户。企业不用自己建机房,也可以按需使用算力。微软Azure、阿里云、腾讯云、百度智能云都属于云平台。
API:应用程序接口,可以理解为软件之间的“插座”。企业通过API调用大模型能力,把问答、写作、识别等功能接入自己的产品。
MLOps:机器学习运维,指把模型从实验室推到真实业务中运行的一套流程,包括部署、监控、更新、评测和故障处理。
边缘计算:把计算放在离用户或设备更近的地方,比如摄像头、汽车、工厂设备,而不是全部传回云端。好处是响应快、隐私风险较低。
液冷散热:用液体帮助服务器降温。AI服务器功耗高、发热大,散热能力会影响数据中心能否稳定运行。
CUDA :英伟达的软件开发平台。很多AI程序依赖CUDA调用GPU能力,这也是英伟达不仅卖硬件、还拥有软件生态优势的重要原因。
知识图谱:把人物、公司、产品、疾病、地点等实体及其关系整理成网络,帮助AI理解“谁和谁有什么关系”。
智能体:能够理解任务、调用工具、分步骤完成工作的AI系统。它不只是聊天,还可能检索资料、写代码、操作软件或生成报告。

P3:文献如何理解AI产业链

现有研究很少只用“AI产业链”这一标题展开讨论,但价值链、通用目的技术、数字平台、创新生态系统和数据网络效应等文献,为理解AI产业提供了互补视角。价值链文献帮助我们看清AI价值从哪里产生,通用目的技术文献解释AI为什么会扩散到许多行业,平台与生态系统文献说明企业为什么经常跨边界合作,数据网络效应研究则指出应用场景会反过来塑造算法和模型能力。把这些文献合在一起看,AI产业链就不只是从上游到下游的线性流程,更像由基础设施、模型能力、数据反馈和行业应用共同构成的动态系统。
(一)从价值链到AI价值链
价值链理论提供了理解产业分工的起点。Porter(1985)把企业价值创造分解为研发、生产、营销、服务等一系列活动,强调不同活动之间的衔接会影响竞争优势。放到AI产业中,价值链可以帮助我们区分“谁在提供底层资源”“谁在开发通用技术”“谁在把技术卖给行业客户”。例如,芯片和数据中心企业承担资源供给,模型公司承担能力生成,行业解决方案公司则把算法嵌入真实业务流程。这个视角的好处在于清晰直观,读者可以沿着价值创造过程理解AI公司之间的差异。
AI价值链显然比传统制造业价值链复杂。传统产业链往往强调原材料、生产、销售和服务的顺序,AI产业中的数据、模型和场景会不断循环。一个智能客服系统在服务用户时会积累对话数据,数据经过清洗和标注后又可能改进模型;一个工业视觉系统在工厂部署后会遇到新的缺陷类型,这些现场样本会反过来推动算法优化。Attard-Frost and Widder(2025)讨论AI value chain时,关注的不只是技术供给,还包括价值分配、劳动、数据来源、平台控制和治理责任。
近年关于Big AI的研究进一步强调基础设施的重要性。van der Vlist et al.(2024)指出,生成式AI的产业化越来越依赖云基础设施和大型科技公司的平台能力。Stanford HAI(2025)的AI Index报告也显示,AI投资、模型训练成本、算力需求和企业采用率正在同步上升。对于普通读者来说,这解释了为什么英伟达、云厂商、智算中心、PCB和散热供应商会在生成式AI浪潮中变得关键:它们提供了大模型真正运行起来所需的底座。
(二)通用目的技术与基础模型
从技术经济学看,AI具有通用目的技术的典型特征。Bresnahan and Trajtenberg(1995)认为,通用目的技术通常具备广泛适用性、持续改进潜力和创新互补性。电力、计算机和互联网都曾表现出这种特征:它们进入许多行业,并且需要企业调整设备、流程、组织和商业模式,才能释放生产率。Brynjolfsson et al.(2019)讨论AI生产率悖论时也指出,新技术的经济效果常常滞后出现,因为组织还需要补足数据、流程、人才和管理制度。
生成式AI让通用目的技术的特征更加直观。Bommasani et al.(2021)提出“基础模型”概念,强调大规模预训练模型可以迁移到多种下游任务。这里的“预训练”可以理解为先让模型读大量文本、图片或代码,形成通用能力,再根据具体场景微调。Feuerriegel et al.(2024)系统讨论生成式AI对企业流程、知识工作和商业模式的影响。与过去面向单一任务训练的小模型相比,基础模型更像一套可复用的能力底座,可以用于问答、翻译、写作、编程、检索、图像理解和流程自动化。
DeepSeek-AI(2025)关于推理模型的研究进一步说明,模型能力的扩散方式也在变化。开源模型、蒸馏模型和强化学习路线降低了部分企业接入先进模型能力的门槛,也让产业竞争从“谁能训练最大模型”扩展到“谁能更高效地部署、微调、评测和应用模型”。这对三层产业链的理解有直接影响:基础层需要支撑更低成本的训练和推理,技术层需要沉淀更稳定的模型服务,应用层则要把模型能力翻译成具体工作流中的效率提升。
(三)数字平台、生态系统与数据反馈
AI产业链还需要平台和生态系统视角。Yoo et al.(2010)指出,数字技术具有层级模块化架构,创新常发生在设备、网络、服务和内容之间的重新组合。Bharadwaj et al.(2013)认为,数字业务战略已经把技术基础设施、业务流程和组织边界连接在一起。Nambisan et al.(2017)进一步把数字创新理解为分布式、开放式和跨边界的过程。这些研究解释了AI公司为什么经常难以用单一产品标签描述:模型要通过云平台交付,应用要接入企业系统,硬件要依赖软件生态,行业客户还会参与需求定义和数据反馈。
生态系统研究则帮助我们理解跨层合作。Adner(2017)强调生态系统围绕价值主张形成多边伙伴结构,Jacobides et al.(2018)关注模块互补和非完全层级控制关系。AI产业中的芯片、PCB、服务器、云平台、模型平台、数据服务商、开源社区、应用开发者和行业客户共同组成生态系统。比如OpenAI的模型能力需要微软Azure等基础设施支持,英伟达的GPU价值也依赖CUDA、开发者工具、模型厂商需求和数据中心客户共同放大。
数据反馈是AI产业链区别于传统价值链的核心特征。Gregory et al.(2021)讨论AI与数据网络效应如何共同创造用户价值:用户交互越多,数据越丰富,算法和产品改进空间越大,产品体验提升后又会吸引更多用户。应用层因此不只是技术层的销售出口。医疗影像、工业质检、智能客服、自动驾驶和教育学习系统中的真实场景数据,都会反向影响模型优化、产品设计和商业模式。

P4:AI产业链的三层划分


(一)基础层:算力、芯片、PCB与数据基础设施
基础层是AI产业的资源底座,可以理解为让AI“有机器可用、有电可跑、有地方可放”。它不仅包括AI芯片和服务器,也包括PCB、存储、电源、连接器、网络设备、数据中心、电力和散热。PCB容易被忽视,但它是芯片和各种电子元件连接的线路板。AI服务器内部要传输大量高速信号,对PCB材料、层数、散热和可靠性要求更高,所以PCB、连接器、散热等环节也会受到AI需求拉动。
基础层里最常被提到的是GPU。GPU可以先理解为一种特别擅长并行计算的芯片。AI模型训练时要同时处理大量矩阵计算,GPU比普通CPU更适合这类任务。NPU或AI加速芯片则更强调为AI任务专门设计,常用于手机、汽车、边缘设备或服务器。服务器是装载这些芯片的高性能电脑,数据中心和智算中心则是集中放置大量服务器的机房和算力集群。云计算把这些资源包装成可以按需租用的服务,企业不用自己买机器,也能使用大规模算力。
从企业案例看,英伟达是基础层最典型的全球企业。它的价值不只来自GPU硬件本身,还来自CUDA软件生态、开发者社区、数据中心产品和与云厂商、模型公司的深度绑定。国内企业中,寒武纪更接近AI芯片和智能计算硬件逻辑,浪潮信息、曙光数创等企业与服务器、智算中心或数据中心基础设施关系更密切,沪电股份、生益科技等PCB或材料企业则属于更上游的硬件配套环节。基础层企业通常离普通消费者较远,却决定AI能力能否以足够低的成本、足够稳定的方式交付给下游。
基础层的商业特点是投入大、门槛高、周期长。芯片设计需要长期研发和供应链协同,数据中心建设需要资本开支、电力资源和运维能力,云平台还需要规模经济和客户生态。基础层一旦形成优势,可能带来较强的议价能力和产业控制力;同时也会承受技术路线变化、供应链波动、资本开支压力和政策监管风险。理解这一层,可以帮助读者看清“GPU涨价”“PCB订单增长”“智算中心建设”“液冷散热需求上升”等新闻为什么会影响整个AI产业。
(二)技术层:算法、模型与平台能力
技术层是AI产业中最容易被公众直接感知的一层,主要包括算法模型、机器学习框架、计算机视觉、语音识别、自然语言处理、大模型、知识图谱、MLOps和模型开发平台。算法可以理解为机器解决问题的方法,模型则是算法在大量数据中学习后形成的能力。计算机视觉让机器“看懂”图片和视频,语音识别让机器“听懂”声音,自然语言处理让机器处理文字,大模型则把这些能力做得更通用、更可迁移。
技术层的关键不只是“模型参数有多大”或“榜单分数有多高”。一个模型要变成产业能力,还需要API服务、模型安全、工程部署、评测体系、开发者文档、插件机制、智能体框架和企业级权限管理。API可以理解为软件之间的插座,企业通过API把大模型接进自己的产品;MLOps则是模型上线后的运维体系,负责监控模型表现、更新版本、处理故障和保证稳定运行。
技术层内部也有分工。一部分企业训练基础模型,如OpenAI、Anthropic、Google DeepMind、DeepSeek、智谱AI、月之暗面、MiniMax等;一部分企业提供模型服务、开发平台和私有化部署,如微软、百度、阿里云、腾讯云等;还有企业围绕数据标注、向量数据库、知识库、模型评测、安全合规和智能体开发提供支撑。生成式AI之后,技术层的边界更加平台化:模型能力会被办公软件、搜索、编程工具、设计工具、企业知识库和智能体应用反复调用。
理解技术层,还需要注意模型能力和可商业化能力之间的距离。研究论文中的模型效果代表技术潜力,稳定服务企业客户则需要成本控制、响应速度、隐私保护、合规审查和持续迭代。很多模型公司会面临一个共同挑战:用户增长会带来更高推理成本,开源模型会压低基础能力的价格,行业客户又要求高度定制。技术层企业要形成长期优势,需要把模型能力转化为平台能力、生态能力和行业交付能力。
(三)应用层:行业场景与商业化转化
应用层是AI技术进入具体行业的环节。对于大多数企业客户来说,他们购买的是能解决具体问题的产品:降低质检误判率、提升客服效率、辅助医生阅片、优化供应链排产、提高营销转化率、帮助员工处理文档和代码。应用层最接近收入和客户,也最能检验AI技术是否真正产生价值。
应用层可以进一步分为行业解决方案、AI产品和终端设备、运营与数据反馈三类。行业解决方案面向制造、医疗、金融、安防、交通、教育、政务等客户,往往需要定制化交付;AI产品和终端设备面向普通用户或企业员工,例如智能客服、办公助手、编程助手、智能驾驶、机器人、AI手机、AI PC和智能摄像头;运营与数据反馈负责把用户使用过程中的数据、问题和需求反馈给模型和产品团队。
企业案例能让这一层更容易理解。科大讯飞长期深耕语音、教育、办公和汽车场景,其价值来自语音识别、自然语言处理和行业产品的结合。海康威视把计算机视觉、物联网设备和行业解决方案结合,典型场景包括安防、园区、交通和城市治理。商汤科技从视觉算法拓展到智慧商业、智慧城市、智能汽车和AIGC。优必选把AI能力与机器人硬件、运动控制和行业服务结合,体现AI与实体设备、现场部署之间的关系。应用层最接近商业化,也最容易出现概念混淆。很多公司会在年报或宣传中使用“智能”“AI+”“大模型赋能”等表达,实际业务可能只是把第三方模型或算法嵌入原有产品。判断应用层企业时,应关注AI是否真正改变产品功能、成本结构、用户体验或数据反馈。例如,一个客服系统只是接入通用聊天机器人,和一个能够接入企业知识库、识别客户意图、自动生成工单并持续优化服务流程的系统,在商业价值上有明显差异。

P5:如何划分AI公司业务:跨层
多元化与单层专注的现实含义

(一)先看企业在产业链中解决什么问题
理解一家AI公司,第一步不是看它是否使用“AI”标签,而是看它主要解决产业链中的哪类问题。基础层企业解决“AI如何跑起来”的问题,典型业务包括芯片、PCB、服务器、数据中心、云计算、液冷散热和网络连接;技术层企业解决“AI如何变聪明、可调用、可部署”的问题,典型业务包括算法、基础模型、大模型、MLOps、模型API、知识图谱和开发者平台;应用层企业解决“AI如何进入真实场景并产生收入”的问题,典型业务包括智能制造、智慧医疗、智慧金融、智能安防、AI办公、智能客服、智能驾驶、机器人和内容生成工具。实际划分时,可以依次看五类证据:第一,主营业务收入主要来自哪里;第二,公司掌握的是硬件底座、模型算法,还是行业解决方案;第三,研发项目和专利名称集中在哪一类技术;第四,客户购买的是算力、模型能力,还是具体产品;第五,应用场景是否能形成持续数据反馈。概念板块只能帮助发现候选企业,不能直接等同于AI企业。对于上市公司研究,更稳妥的做法是结合年报中的主营业务、核心技术、主要产品、研发项目和专利方向进行核验。
(二)跨层多元化:协同更强,管理也更难
很多AI企业不会只停留在一个层次。英伟达是最典型的例子。它的核心收入和竞争优势来自GPU、数据中心产品和高速互联,位置明显偏基础层;但CUDA、软件库、开发者社区和AI Enterprise等软件生态又把它延伸到技术层。英伟达并不直接经营大量行业应用,却通过基础层和技术层的深度绑定,成为全球AI产业链的关键平台型企业。这个例子说明,跨层并不一定意味着平均布局三个层次,也可能是以某一层为主轴,向相邻层延伸以强化主业护城河。字节跳动则更像技术层和应用层融合的企业。它依靠推荐算法、大模型、内容理解、多模态生成和广告系统形成技术能力,又通过抖音、TikTok、剪映、豆包、火山引擎和电商等场景实现应用落地。与英伟达相比,字节跳动在芯片和硬件基础层并不占主导,但它在技术层和应用层之间形成强反馈:用户行为和内容生态为算法迭代提供数据,算法和模型又提高内容分发、广告转化、创作效率和用户体验。
跨层多元化的好处在于,企业能够把算力、模型、数据和场景连接起来。科大讯飞既有语音识别、自然语言处理和大模型能力,也把这些技术用于教育、办公、汽车和医疗等场景;海康威视把计算机视觉、摄像头、物联网设备和行业解决方案结合,在安防、交通、园区和城市治理中形成应用闭环。对这类公司来说,跨层布局有助于提高技术商业化速度,也有助于通过场景数据反哺模型和产品。
但跨层多元化也不是越多越好。基础层需要重资产投入,技术层需要持续研发和高端人才,应用层需要销售、交付、客户服务和行业知识。如果企业同时铺开多个层级,却没有足够技术积累、资金能力和组织协调能力,就容易出现资源分散、项目过多、研发方向摇摆和商业化效率下降。现实中,一些公司在生成式AI热潮中快速贴上“大模型”“智能体”“AIGC”等标签,但缺乏稳定产品和收入,这类跨层表述更多是概念扩张,不能简单视为高质量多元化。
(三)单层专注:定位更清晰,但也可能受制于上下游
专注某一层次也有明显优势。寒武纪更接近基础层企业,业务主要围绕AI芯片和智能计算硬件展开。这样的企业定位清晰,研发资源集中,容易在特定技术环节形成深度积累。中际旭创、新易盛、光迅科技等光模块和通信设备企业也更接近AI基础设施的上游配套环节,它们未必直接开发大模型或行业应用,但在AI数据中心扩张中具有重要位置。
技术层专注企业的代表包括专注算法、模型、知识图谱、语音识别、计算机视觉或开发平台的公司。它们的优势在于技术复用性强,能够服务多个行业,理论上具有较好的规模扩张潜力。但如果缺乏应用场景和客户入口,技术层企业也可能面临商业化周期长、客户需求不明确、收入确认困难等问题。OpenAI早期更偏技术层,后来通过ChatGPT直接进入应用层,就是为了把模型能力转化为真实用户和商业收入。
应用层专注企业更接近客户和收入。例如蓝色光标、中文在线、视觉中国等公司更容易围绕内容生产、营销、版权素材和AIGC应用形成产品;金山办公把AI嵌入办公软件,提升文档处理、写作、表格和演示效率。应用层企业的优势是场景明确、客户需求具体、商业化路径短;不足在于,如果缺少自有模型、数据和底层技术,可能容易被上游模型平台替代,或者只能在同质化应用中竞争。
(四)用于研究时,可以把企业分成“主层级+跨层特征”
如果把这一框架用于实证研究,不建议把每家公司强行归入唯一类别。更合理的做法是先判断主层级,再记录其是否涉及其他层级。例如,英伟达可以被理解为“基础层主导,向技术层延伸”;科大讯飞可以被理解为“技术层主导,深度进入应用层”;海康威视可以被理解为“应用层主导,依托视觉技术和硬件设备”;寒武纪则更接近“基础层专注”。
需要强调的是,高多元化不必然代表更强竞争力,低多元化也不代表落后。高多元化企业可能获得跨层协同,但也更依赖组织管理、资金和生态协调能力;低多元化企业可能在某一环节做深做强,但也可能受制于上下游平台或客户场景。真正有解释力的问题是:企业的层级布局是否与其技术能力、资源条件和商业化路径匹配。
END
注:本文部分观点内容由AI生成,不代表本人意见。
夜雨聆风