当AI学会编程,芯片学会＂折叠＂:一场正在发生的双重革命

扣子编程让普通人10分钟造出AI应用，华为韬定律让芯片绕过摩尔定律的墙，DeepSeek V4则把这两个故事焊在了一起。

一、一个不会写代码的人，10分钟做了个AI助手

2025年12月，字节跳动旗下扣子（Coze）上线了一个叫"氛围编程"（Vibe Coding）的功能。

你不用写一行代码，不用懂什么API、什么工作流，只需要用中文说：

"帮我做一个竞品监控助手，每天自动搜索行业新闻，整理成SWOT分析，推送到飞书群。"

扣子就能自动生成一个完整的AI智能体——搜索、分析、排版、推送，全链路打通。

这不是PPT演示，是真实可用的产品。

扣子的2026年版本已经集成了1000+插件，支持AgentPlan意图驱动编程、AgentSkills模块化能力封装，做好的智能体一键发布到微信、飞书、抖音、小程序。个人用户免费额度足够日常使用，企业版支持私有化部署。

从"人人可用AI"到"人人可造AI"——这个门槛的降低速度，比大多数人想象的要快得多。

智联招聘的数据：2026年春节后，AI智能体相关职位数同比增速455%，初级智能体开发工程师年薪40-60万。

当编程不再是程序员的专利，AI的能力需求就会呈指数级膨胀。 每一个"10分钟做出来的AI助手"背后，都是百万级Token的消耗、是大模型的实时推理、是对算力的无底洞般的渴求。

于是问题来了：算力从哪来？

二、摩尔定律走到尽头，谁来接棒？

过去60年，半导体产业只做一件事：把晶体管做小。

1965年，戈登·摩尔提出那条著名的定律——芯片上的晶体管数量大约每两年翻一倍。从90nm到28nm，从7nm到3nm，"几何缩微"的路线跑了半个世纪，把人类从打字机送到了ChatGPT。

但这条路，快走不通了。

物理极限：到了2nm、1nm，一个原子就是一个台阶。量子隧穿效应让电子"穿墙漏电"，漏电流越来越大，功耗散热成了噩梦。

经济极限：一座3nm晶圆厂动辄200亿美元，全球玩得起的玩家从几十家缩到三四家。先进节点的每晶体管成本不再下降，甚至开始上升。

供应链极限：对中国企业来说，还有一层——先进光刻设备获取受限。继续假设"下一个节点会解决问题"，已经不现实了。

一边是AI对算力指数级的饥渴，一边是芯片微缩的边际收益急剧递减。这个剪刀差，就是整个行业必须回答的根本问题。

2026年5月25日，华为给出了自己的答案。

三、韬（τ）定律：不再死磕"几纳米"，而是让信号跑得更快

在上海举行的IEEE国际电路与系统研讨会（ISCAS 2026）上，华为董事、半导体业务部总裁何庭波发表主旨演讲，正式提出"韬（τ）定律"。

这是中国在全球半导体领域首次提出指导产业发展的新原则。

"韬"不是某个人的名字，而是电路理论中的时间常数τ（希腊字母tau）。

简单说：τ = 电阻 × 电容。它代表信号在芯片里从0变到1（或从1变到0）所需的切换时间。τ越小，芯片越快。

过去50年，降低τ的方法是缩小晶体管——晶体管小了，电阻电容跟着小，τ自然降。但到了3nm以下，晶体管自己的延迟已经极小，反而是连接晶体管的导线被迫做得越来越细，内阻反而升高，τ反而变大。

摩尔定律赖以运行的底层逻辑——"做小就能变快"——失效了。

韬定律的核心转变是：以"时间缩微"替代"几何缩微" 。不再死盯着把晶体管做更小，而是通过系统性地压缩信号传播时延，来实现同等的性能提升。

打个比方：不是扩建马路（几何缩微），而是优化红绿灯、修高架桥、设置潮汐车道，让交通流更顺畅（时间缩微）。

实现这个目标的关键技术，叫逻辑折叠（Logic Folding） 。

传统芯片的电路布局是二维平面的，信号在平面上绕来绕去。逻辑折叠把电路从"一层楼"扩展成"多层楼"，把原本需要长距离横向走线的关键路径"折"起来，纵向叠放，大幅缩短信号传播的物理距离。

而逻辑折叠只是韬定律四层级体系中的一环。华为构建了贯穿器件→电路→芯片→系统的协同优化体系：

器件层
：优化晶体管和互连的电阻、寄生电容
电路层
：逻辑折叠突破平面布局的物理边界
芯片层
：全栈"软件+架构+芯片"协同设计
系统层
：定义"灵衢总线"，重构互联协议，实现超节点统一内存编址

何庭波透露：过去六年，华为已基于韬定律设计并量产了381款芯片。今年秋季，新一代麒麟芯片将完整采用逻辑折叠技术，预计到2031年，基于韬定律的高端芯片晶体管密度将达到1.4纳米制程的同等水平。

这意味着：不完全依赖EUV极紫外光刻机，也有机会达到国际先进性能。

何庭波的原话是："我们的解决方案走得通，走得远。我们新芯片的性能完全可以持续对标另外一条路径。"

四、DeepSeek V4：国产算力不是"备胎"，而是"另一条路"

韬定律画出了芯片演进的蓝图，但蓝图需要验证。

2026年4月24日，DeepSeek V4给出了第一份答卷。

V4发布时，最让产业界紧张的，不是1.6万亿参数的V4-Pro，不是100万Token的标配上下文，而是技术报告里一句话—— "我们验证了细粒度EP方案在英伟达GPU和华为昇腾NPU双平台上的表现。"

这是全球顶级大模型首次将华为昇腾芯片与英伟达GPU并列写入硬件验证清单。

这不是象征性的"兼容"勾选。DeepSeek团队为此投入了约30人年的工程量，重写了200多个核心CUDA算子，跑了10万多个测试用例做精度对齐，产品发布推迟两个多月专门完成移植。最初移植版本性能只有目标的1/35，最终优化到持平。

结果：

昇腾950PR单卡推理性能达到英伟达H20的2.87倍
推理延迟较前代降低35%
单机算力成本较英伟达方案下降40%
V4-Flash后训练在昇腾上完成，证明昇腾具备承接主流大模型后训练任务的能力
V4-Pro API价格永久降至原价的1/4，输入最低0.025元/百万Token

V4采用的FP4精度格式，恰好是昇腾950芯片原生支持的精度。昇腾950的FP4算力1.56P，卡间互联带宽2TB/s——V4在昇腾上的运行不是"勉强能跑"，而是原生友好。

发布24小时内，寒武纪、海光、摩尔线程等8家国产芯片厂商完成推理适配。华为云、腾讯云同步上线昇腾版V4 API服务。

5月22日，国家发改委正式发声：将指导国产大模型加大力度适配国产算力芯片。

英伟达CEO黄仁勋在近期播客中说了一句话："如果顶尖的AI模型被优化在华为芯片上运行，对美国而言将是'可怕的后果'。"

他担心的，正是这件事。

当然，清醒地看，差距仍在：预训练仍依赖英伟达H800/H100，CANN算子覆盖率约92%，多卡互联带宽仍落后于NVLink。从"能推理"到"能训练"到"能全面替代"，还有路要走。

但方向已经验证：国产算力不是退而求其次的备胎，而是另一条可行的路。

五、三个故事，一条线

回到开头——

扣子编程降低了AI应用的创造门槛，普通人10分钟能造出AI助手。但这意味着千行百业对算力的需求将从涓涓细流变成洪流。

华为韬定律打开了芯片演进的新路径：不依赖无限缩小晶体管，而是让信号跑得更快。预计到2031年达到1.4nm等效水平。

DeepSeek V4则把"新路径"和"新需求"焊在了一起：全球顶级大模型在国产芯片上跑通了，而且跑得还不错。

三个故事，一条逻辑线：

AI能力爆发 → 算力需求爆炸 → 摩尔定律见顶 → 韬定律开新路 → "国模+国芯"闭环验证

这不是三个孤立的热点，而是中国AI产业在2026年同时突破"软件"和"硬件"两个瓶颈的集中体现。

何庭波说："未来一定属于开放合作。"

黄仁勋说："如果顶尖模型在华为芯片上跑得更好，那将是可怕的后果。"

两种立场，指向同一个事实：这场关于算力的竞争，格局已经变了。

参考资料：

华为正式发表半导体领域新定律，人民日报客户端，2026.05.25
华为提出「韬定律」，寻找国产芯片自己的进化方向，36氪，2026.05.25
DeepSeek-V4 旗舰模型技术深度报告，CSDN，2026.05.22
DeepSeek-V4+昇腾——国产AI基础设施的破局之战，CSDN，2026.05.23
DeepSeek V4验证华为昇腾950：国产AI芯片的供应链大考，网易新闻，2026.05.21
DeepSeek V4 × 华为昇腾：国产AI算力推理适配的实质性进展，51CTO，2026.05.19
DeepSeek V4发布后没人统计过的那一栏数字，风远科技，2026.05.24