大家都以为AI快能造火箭了,实际上它连个标准螺母都画不准

大家都以为AI快能造火箭了，实际上它连个标准螺母都画不准

已关注

关注

重播分享赞

视频详情

你有没有见过那种"AI生成的未来汽车3D渲染图"？

炫酷、科技感、分分钟10万+点赞。

但如果把这张图发给工厂的制造工程师，他们的反应通常只有一个：

直接打退堂鼓。

原因很简单。

那些看起来科技感爆棚的3D模型，内部结构可能根本不符合物理学定律。

螺栓对不上螺孔、壁厚不均匀、公差直接爆表。

这种模型在工业制造里，就是一堆毫无用处的"电子垃圾"。

大模型在艺术创作上已经"遥遥领先"，但在面对需要毫米级甚至微米级精度的现代工业时，它就像一个连圆规都没拿稳的门外汉。

一、高考季的一道"加试题"

今年正值高考季。

某款AI产品参加2025年北京海淀区高三二模考试，总成绩697分，达到了清北学霸水准。其工整的数学解题步骤，一度让阅卷老师误以为是出自一位极度优秀的考生之手。

AI考了清北分数，全网沸腾。

但没人问另一个问题：

如果让AI参加工程制图的"职业技能高考"，它能得多少分？

这个问题，比考语文数学难多了。

语文作文可以靠华丽辞藻糊弄，数学步骤可以硬算出来。

但工业零件设计不一样。

它要求的不是"大概对"，而是"精确到微米"。

差一点点，机器就转不起来。

差一点点，航空发动机叶片就会在高温高压下断裂。

差一点点，桥梁就可能垮塌。

工业制造，容错率为零。这是AI目前最难翻越的那堵墙。

二、工业界坐不住了

最近，开源社区巨头 Hugging Face 联合工业AI先锋 Mecado，正式推出了一个重磅项目：

CADGenBench

这是一个专门衡量 AI 系统生成"工程级3D零件"能力的基准测试。

简单说，就是给AI工业设计师们出了一套极其硬核的"全国高考统一试卷"——只不过这张卷子考的不是语文数学，而是能不能造出一颗合格的螺丝钉。

CADGenBench 的核心逻辑很清晰：给AI一张工程图，让它生成一个有效的3D CAD模型；或者给AI一个 STEP 文件加上修改需求，让它正确编辑。基准测试完全独立于工具——任何CAD软件栈都可以使用，提交的只需要是 STEP 文件。模型评分维度包括：几何精确度、拓扑正确性、接口兼容性和CAD有效性。

"虽然目前的模型能够生成3D模型，但它们的精确度远远不够，无法用来制造出可正常使用的部件。" —— Michael Rabinovich，CADGenBench 项目核心推介人

三、这张工业"考卷"到底考什么？

传统的AI生成3D，玩的是"概念"和"视觉效果"。

CADGenBench 则是直接把AI拉到了真实的工厂车间里。

它不看好不好看，只看能不能用。

任务一：2D工程图纸转3D模型

这是典型的"看图说话"。

AI必须看懂图纸上的三视图、公差标注、尺寸线，然后严丝合缝地把真实的3D零件建出来。

听起来简单，实际极难。

人类工程师学这个技能，往往需要在学校学三年制图，再实习两年才能做到"看图不走样"。

AI面对同样的任务，目前的表现，我们下面会看数据。

任务二：根据需求修改现有STEP文件

这是典型的"改需求"。

给AI一个现成的标准工业格式文件，让它在保证其他结构不动的前提下，把某个孔径扩大2毫米，或者增加一个加强筋。

这考的是 AI 对"局部修改、全局不破坏"的理解能力。

工程设计里有句行话叫"牵一发而动全身"——改一个孔，可能导致整个零件的应力分布改变。能做到精准局部修改，才是真正的工程智能。

整个评测流程如下：

在提交评分之前，系统会先检查提交的 STEP 文件是否代表一个有效的 CAD 模型。这个模型必须同时满足：结构良好、水密、可网格化、流形。任何一项检查失败，总分直接为零。

更硬核的是，这个基准测试完全独立于工具。

不管你背后用的是 GPT-4、Claude 还是任何私有大模型，也不管你是用 Python 的 build123d 库写代码，还是调用 Onshape、Autodesk 的 API。

它只看最终交上来的3D零件质量。

四、数据不会撒谎

测试结果，直接撕下了很多AI厂商宣称的"AI颠覆工业设计"的虚假外衣。

模型与环境组合	综合得分	纯生成验证率	编辑验证率
真实现实标准（Truth）	1.000	100%	1.000
Claude 4.7 HF Pro（优化版）	0.387	88%	0.489
Claude 4.7 HF Opus Baseline	0.369	94%	0.477
HF Baseline（基于 build123d）	0.360	88%	0.455

即便是经过优化的顶尖大模型方案，综合得分也才突破 0.387。

这个数字意味着什么？

打个比方：如果满分100分代表"可以直接送上机床加工"，那么0.387分意味着，当前最好的AI方案，给工程师交出的零件里，只有不到40%达到了"勉强能用"的门槛。

剩下那60%，送到工厂就是废品。

这意味着：在缺乏人类工程师干预的情况下，AI独立完成的工业零件，大部分是没法直接送上机床加工的。

五、为什么AI在这件事上这么难？

很多人会好奇：AI能写诗、能编程、能做数学竞赛题，为什么连个螺母都画不准？

这个问题背后，藏着AI能力边界最深层的秘密。

原因一：工业语言和自然语言完全不同

大模型是在海量文字数据上训练出来的。

它擅长"表达"和"理解"，但工程设计本质上是一种参数化约束语言。

一张机械图纸，核心不是"这个零件好不好看"，而是"M8螺纹孔距左边界23.5±0.02毫米"。

这种精确的约束逻辑，和写作文的逻辑是两种完全不同的智能。

原因二：拓扑错误是致命的

CADGenBench 通过比较生成零件和参考零件的贝蒂数来衡量拓扑正确性：b₀代表连通分量数量，b₁代表通孔或把手的数量，b₂代表封闭腔体的数量。这些数量独立于用于创建模型的CAD系统。

简单说，AI生成的零件，哪怕外形看起来差不多，但"孔的数量不对""腔体的连通方式错误"，都会导致零件在物理世界里根本无法组装。

这不是精度问题，是拓扑结构的理解问题。

原因三：训练数据的先天不足

网络上流传的3D内容，99%都是游戏素材、影视特效、艺术创作。

真正符合工业标准的 STEP 格式零件库，大多藏在企业内网的 PLM 系统里，从不对外开放。

这就导致大模型从出生起，就缺乏"工业基因"。

工业数据是一口枯井。AI喝不到水，就永远学不会怎么造螺丝钉。

六、国内外巨头已经坐不住了

这场工业AI的竞赛，不只是学术界在关注。

西门子：工业AI操作系统的野心

在CES 2026上，西门子发布了与NVIDIA合作共建的工业AI操作系统，旨在通过AI彻底重塑从设计、工程到制造、生产、运营乃至供应链的完整工业价值链。西门子还推出了九个工业副驾驶（Copilot），将智能能力覆盖到工业价值链的各个环节。

西门子CEO Roland Busch在CES 2026上直接喊话："就像电力曾经改变了世界，工业正在向AI驱动转型。工业AI不再是一个功能，而是一种将重塑下一个世纪的力量。"

Autodesk：AI原生设计云

Autodesk在2026年10月披露了其AI驱动的行业云创新，包括对Fusion和Forma平台的AI原生增强，以生成式能力来简化设计和工程工作流。

中国的追赶与布局

2025年底，工业和信息化部等八部门印发《"人工智能+制造"专项行动实施意见》，明确提出到2027年"推出1000个高水平工业智能体"，打造500个典型应用场景。工信部同步首次将"基于大模型的零部件设计软件""流体仿真智能软件""结构仿真智能软件"等智能工业软件列入揭榜挂帅方向。

2026年政府工作报告甚至首次提出"打造智能经济新形态"。

国家意志已经非常明确：工业AI是下一轮产业竞争的制高点。

数据显示，2025年全国智能工厂数量突破3万家，带动生产效率提升22.3%，研发周期缩短近三成。AI大模型解决方案市场2025年上半年规模达30.7亿元，同比增长122.1%。

市场已经在爆发，但真正的工程级AI工具，还差着最后一公里。而CADGenBench的出现，正是为了丈量这最后一公里到底有多远。

七、这不只是技术问题，是一场"工业高考"的人才战争

说到高考，再插一个有意思的角度。

今年高考刚结束，无数考生正在焦虑地填报志愿。

很多人在问：学什么专业，将来不会被AI取代？

答案其实就藏在CADGenBench的数据里。

AI在语言、绘画、代码生成上已经展现出强大能力，但在这道"工业制图高考"里，最好的AI选手也只拿到了38分（满分100分）。

这意味着什么？

意味着那些站在"物理约束"和"工程精度"交叉点上的职业，将在未来相当长一段时间内保持稀缺价值。

智能制造工程专业毕业生就业前景广阔，可在智能产品研发、工业机器人开发、智能装备制造、智能工厂系统集成、高端装备智能运维等领域从事技术研发工作，亦能胜任智能制造项目管理、数字化产线管理、生产信息化管理等职能岗位。

真正难以被AI替代的工程师，不是只会用CAD软件"画图"的人，而是那些：

理解物理约束、能看懂公差背后的工艺逻辑的人
能把模糊的产品需求转化为精确参数化约束的人
能判断AI生成的零件"哪里不对"的人

未来最值钱的工程师，是能和AI协作、又能审判AI输出的人。

这不是AI能替代的岗位。这恰恰是AI创造的新岗位。

高考考的是你能不能进好大学。而工业AI时代真正的考题是：你能不能成为那个给AI打分的人？

八、未来3到5年：谁在吃肉，谁在挨打？

CADGenBench 的出现，意味着3D工业AI正式从"讲故事阶段"迈向了**"指标化阶段"**。

根据市场预测，全球产品设计与工程领域的生成式AI市场规模预计将从2026年的70.2亿美元增长至2034年的391.2亿美元，年复合增长率达24%。

这是一场确定性的大爆发。

但爆发的红利，不会均匀分配。

会被淘汰的那批：

那些提供纯视觉、没有物理工程约束的"3D概念生成器"，将迅速边缘化。

工业界不缺花架子，缺的是能直接进 ERP 和 MES 系统的生产力工具。

没有工程约束的"好看3D"，在工厂里连废品都算不上——因为废品至少还能进炉子回收原材料，这类模型连打印出来都没意义。

会迎来机会的那批：

深耕工业垂类数据、能够将 LLM 与代码化 CAD 编程环境深度融合的团队，将迎来泼天富贵。

传统的 CAD 巨头（如 Autodesk、西门子）也已被迫加速开放 API。

未来的设计师，可能不再通过图形界面手动拉伸方块，而是通过自然语言指挥AI智能体，自动生成数万个迭代版本，再由类似 CADGenBench 的评测引擎自动筛选出最优解。

设计师的工作将从"用手画图"变成"用嘴出题、用眼审图"。而能给AI出好题目、看懂AI交卷的人，将成为新时代最稀缺的工程人才。

国产工业软件的弯道超车机会：

在AI技术席卷全球的背景下，中国国产CAD软件正在借助AI实现能力重构，国产工业软件正从"追随者"向"引领者"跨越。

这不是口号。

过去，国产CAD软件因为功能积累弱、用户习惯迁移成本高，始终难以撼动 Autodesk、西门子的垄断地位。

但AI重写了游戏规则。

当设计流程从"手动建模"变成"AI智能体建模+工程师审核"时，谁掌握了更好的工业垂类数据，谁就掌握了新的竞争优势。

而中国制造业拥有全球最大规模的工厂生产数据。

这一次，中国有机会不再做追随者。

九、工业AI探索者的下一步

如果你正在这个方向上，有三件事值得现在就做：

① 立即部署

前往 Hugging Face 上的 CADGenBench 提交空间，用你现有的 pipeline 跑一次基准测试，摸清真实底细。

别相信厂商的演示PPT，只相信自己跑出来的数字。

② 技术对齐

仔细研究项目开源的 build123d 参考基准，理解如何将非结构化的文本指令转化为确定性的参数化代码。

这中间的 gap，就是你的技术壁垒所在。

③ 资产沉淀

停止收集无用的3D表面网格数据。

开始梳理、清洗企业内部带有标准特征树和 B-Rep 表达的 STEP 资产。

这才是未来工业大模型训练的绝对"黄金"。

网格数据（Mesh）就像是一张照片，看起来像，但无法编辑、无法加工。

B-Rep 数据才是工业AI真正需要的"基因图谱"。

早一天开始沉淀，就早一天建起竞争壁垒。

写在最后

今年高考，AI考了700分。

但工业界给AI出了另一套卷子，AI只得了38分。

这两个数字放在一起，揭示了一个深刻的现实：

AI的强大，是有边界的。

它在语言、推理、创意上的能力，已经超越了大多数人类。但在"毫米级精度""物理约束""工程逻辑"组成的工业世界里，它还是个刚入门的实习生。

CADGenBench 给了我们一把能量化的"尺子"，告诉我们 AI 离真正的工程制造还有多远。

但这把尺子的意义，不只是测距离。

它更重要的作用，是指出了方向——那些能把AI和工程约束真正融合在一起的团队，将在未来10年里，重新定义什么叫"制造强国"。

科学的发展，往往不是始于新理论的建立，而是始于第一把高精度量具的诞生。有了这把尺子，AI在工业领域的进化，才算真正踩下了油门。

加个彩蛋，给正在填志愿的同学们：

如果你今年参加了高考，正在纠结选什么专业——

智能制造工程、机械工程（AI方向）、工业软件，这三个方向，接下来十年可能是最被低估、也最有爆发潜力的赛道。

原因很简单：

AI已经能写代码、能画画、能做客服。

但AI还不能造好一颗螺丝钉。

而你，可以成为教AI造螺丝钉的那个人。