想象一下这个场景:
你打开手机上的某个应用,想让它帮你总结一篇文章。你点下按钮,应用把整篇文章的文本发送到了几千公里外的一座数据中心。在那里,一台价值数万美元、由某家美国公司独家供应的GPU开始运转,消耗着不小的电力,跑了几秒钟推理,然后把结果通过网络传回你的手机。这一切顺利的前提是:那台服务器没宕机,API配额没超,你的信用卡没过期,供应商没涨价,那家芯片公司的出口许可证也没被撤销。
听起来是不是有点荒诞?但这就是今天绝大多数AI应用的日常。
过去两年,“加个AI功能”几乎成了所有软件开发的标配动作。开发者们的做法出奇一致——调个OpenAI或Anthropic的API,把数据丢给云端大模型,等一个JSON响应回来。快是真的快,省事也是真的省事。但问题在于,这根本不是在开发一个功能,而是在签一份供应链卖身契。
当你把AI交给云端,你到底依赖了什么?
unix.foo上那篇引发广泛讨论的文章说得一针见血:把AI功能建立在云端模型之上,等于给应用引入了至少五重依赖——网络状况、外部服务商的正常运行时间、速率限制、账户计费、以及你自己后端的健康状况。任何一个环节出问题,功能就挂了。你的用户不会怪OpenAI,只会怪你。
更讽刺的是,他们口袋里那台手机的芯片,算力已经“mind-bogglingly faster than what was available a decade ago”,里面那块专用的神经网络引擎大多数时候在摸鱼,而用户却在等一个从弗吉尼亚州服务器农场飞回来的JSON包。
但技术层面的脆弱性只是冰山一角。真正值得从供应链视角来审视的,是这个行业正在以惊人的速度把自己锁进一根极其脆弱的管道里。
链条上的几个“单点”
如果你画一张今天AI产业的供应链地图,会发现它出奇地细。
首先是一张显卡决定了所有人的命脉。 NVIDIA在AI加速芯片市场上占据了80%到95%的份额,其H100等GPU几乎成了所有主流AI模型训练和推理的“标配硬件”。这意味着什么?意味着无论你是硅谷的AI巨头还是国内的创业公司,无论你跑的是ChatGPT级别的超大模型还是某个应用里的摘要功能,你的算力命脉都拴在同一家公司的产能上。
然后是造芯片的人比卖芯片的更稀缺。 这些AI芯片的主流制程正从4nm快速转向3nm,而目前3nm先进制程几乎由台积电独家供应。2026年,AI运算芯片大量涌入3nm节点,产能压力进一步加剧。更夸张的是,苹果已经提前锁定了台积电2026年2nm芯片超过50%的首批产能。换句话说,在最尖端的芯片制造环节,全世界都在排一家工厂的队。
地缘政治则在给这根已经很细的链条打结。 美国对华出口管制层层加码,NVIDIA专门为中国市场设计“降级版”芯片,但即便如此,政策仍在反复摇摆——2025年底刚批准H200芯片对华出口,背后则是持续的博弈与不确定性。中国方面则开始要求国有数据中心优先采购国产AI芯片,华为、寒武纪等企业加速替代进口GPU。半导体供应链正在被地缘政治撕成碎片,这对依赖于全球协作的AI产业来说意味着什么,不言而喻。
在这张地图上,还有更多被忽略的瓶颈:高带宽内存(HBM)价格较2025年底飙升了80-90%,CoWoS先进封装产能从来就没够过,甚至关键原物料也在全面告急。ASML的CEO直接表示,未来二到五年,市场将持续处于“供应受限”状态。
换句话说,今天AI产业的供应链不是“可能存在风险”——它本身就是一个风险集中营。
脆弱的不仅仅是硬件
供应链的脆弱远不止于硬件层面。GrapheneOS团队在一篇引发广泛讨论的帖子中揭示了一个更隐蔽的依赖关系:Apple和Google正在通过硬件证明机制(Hardware Attestation),逐步垄断谁能运行什么软件。
简单来说,Google的Play Integrity API和Apple的App Attest API,正在被越来越多的银行、政府服务和商业应用采纳为强制要求。表面上这是“安全功能”,但实际上,它的目的和效果是禁止人们使用未经Apple或Google批准的任何硬件和操作系统。
更令人担忧的是,这个网正在越收越紧。Google的reCAPTCHA正在推出“移动验证”功能,要求没有iOS或Google认证Android设备的用户通过扫码来完成验证。这意味着未来你能否正常访问大量网站,可能取决于你有没有一台被大公司认证过的手机。
这本质上是一种认证供应链的垄断。Apple和Google在移动操作系统上已经形成了双头垄断,而硬件证明机制正在把这种垄断从操作系统层面延伸到整个互联网的基础设施层面。如果一个服务要求Play Integrity验证,那么即使你的手机跑的是比原厂系统安全得多的GrapheneOS,你也会被拒之门外——不是因为不安全,而是因为没有缴纳Google的“认证税”。
当你的AI应用不仅依赖云端模型、还依赖云端模型背后的芯片、依赖芯片背后的制造厂、依赖制造厂所在地区的政治稳定、甚至还依赖操作系统层面的认证许可时——你拥有的不是一个AI功能,而是一整条随时可能断裂的信任链。
本地AI:一场供应链的“去中心化”实验
正是在这个背景下,unix.foo作者提出的“Local AI Needs to be the Norm”才显得格外切中要害。
作者用自己做的一个项目作为例证。他开发了一款名为Brutalist Report的新闻阅读应用,其中的AI摘要功能完全运行在本地——使用Apple的系统内置模型API,不需要服务器中转,不记录任何提示词或用户日志,不需要供应商账户,甚至不需要“我们将存储你的内容30天”这种隐私政策脚注。
这意味着什么呢?从供应链角度看,他砍掉了几乎整条依赖链:
没有GPU供应风险——用的是用户设备自带的芯片。没有网络中断风险——本地推理不需要联网。没有供应商锁定——系统内置模型是平台级的,不绑定任何第三方。没有隐私合规负担——数据从未离开过设备,根本不需要隐私政策。
Apple在本地AI工具链上的投入也值得关注。它的FoundationModels框架让开发者可以直接定义Swift结构体作为AI输出的类型,模型会自动填充字段——这不只是UX上的优化,而是把AI从一个“调用外部服务的黑箱”变成了一个“可信赖的本地子系统”。
但“本地AI”的供应链同样有隐忧
不过,如果以为本地AI就是对供应链依赖的终极解药,那也过于乐观了。
本地AI不去掉对芯片的依赖,它只是改变了依赖的位置。 在云端AI模式下,算力集中在少数超大规模数据中心,GPU是NVIDIA的,制造是台积电的,但至少你有一个明确的责任方。在本地AI模式下,算力分散到了数十亿台设备上,但每台设备里的那枚“神经网络引擎”依然需要被制造出来,依然依赖先进制程,依然离不开那几家工厂。
而且,本地AI对硬件的要求并不低。设备需要足够强大的NPU(神经网络处理器)、足够的内存带宽、足够的能效比。这些硬件指标反过来又会塑造本地AI的供应链格局——谁能造出最好的端侧AI芯片?目前来看,Apple的A系列和M系列芯片、高通的骁龙平台、以及Google的Tensor芯片都在这个方向上竞争,但它们背后又回到了同一个台积电。
更隐蔽的风险是生态绑定。 当你使用Apple的FoundationModels API做本地推理时,你的应用就和Apple的生态绑定了。这和依赖OpenAI API在形式上是不同的——一个依赖的是服务合同,一个依赖的是平台生态——但本质上都是一种锁定。只是锁链的材质从“法律条款”变成了“操作系统API”。
这也是为什么GrapheneOS团队对硬件证明机制的警告如此重要:如果平台方既能控制你的硬件、又能控制你的软件认证、还能决定哪些AI功能可以本地运行,那么所谓的“本地AI自主权”也可能只是围墙花园里的自由。
真正的解药是什么?
供应链安全的核心原则从来不是“找到更可靠的供应商”,而是减少对供应链的依赖本身。
这在AI领域意味着几件事:
第一,能跑本地的,就别跑云端。 正如unix.foo作者所言,大多数应用里的AI功能——摘要、分类、提取、改写——根本用不上什么“能写莎士比亚、能解释量子力学、能通过律师资格考试”的超级模型。本地模型在这些任务上已经足够出色,而你在隐私、可靠性、成本上获得的收益是巨大的。
第二,对算力供应的多元化。 从产业层面看,分散NVIDIA的垄断地位、扶持更多芯片供应商、推进RISC-V等开放架构的AI芯片、发展“云端训练+本地推理”的混合架构,这些都是降低供应链集中度的重要手段。
第三,保持软件栈的开放性。 本地AI不能成为新的围墙花园。如果每个平台都锁死自己的AI API,那么开发者不过是从依赖OpenAI变成了依赖Apple或Google,供应链风险只是换了张脸。开放的模型格式(如GGUF)、跨平台的推理引擎(如llama.cpp)、标准化的AI API,这些才是保障本地AI生态健康的底层基础设施。
第四,也是最根本的——重新审视“AI everywhere”这个口号。 作者说得很好:“AI everywhere is not the goal. Useful software is the goal.” 每当我们往产品里加一个AI功能时,都应该问自己:这真的是在为用户创造价值,还是在往依赖清单上多加一行?
回到那个问题
供应链从来不只是关于货物的流动。它关乎权力——谁控制了什么节点,谁就能决定什么可以运转、什么不行。
当你的AI功能需要调用某个API时,你依赖的是那个API背后的公司。当那个API需要NVIDIA的GPU时,你依赖的是NVIDIA。当NVIDIA需要台积电的产能时,你依赖的是台积电。当台积电的工厂位于某个地震带上、某个地缘政治敏感区域时——你真的还觉得这只是一个“技术选型”的问题吗?
本地AI不只是一个隐私选择,它是一个供应链选择。 每一次你把推理任务留在设备上,你就从那个脆弱的长链条上剪掉了一环。每一次你选择平台级API而非第三方云服务,你就把外部供应商依赖变成了设备能力依赖。
这不是说云端AI没有存在的必要。有些任务确实需要远超单台设备所能提供的算力。但问题是——你的那个摘要功能,真的需要一座数据中心吗?
下一次,当你准备在代码里写下一行openai.chat.completions.create()的时候,不妨停下来想一想:这条调用链的尽头,是谁?
---
本文基于unix.foo《Local AI Needs to be the Norm》和GrapheneOS团队的供应链安全分析撰写,部分产业数据来源于TrendForce、EDGEN、IDC等机构报告。
夜雨聆风