🔥 续:AI说的这些PLC bug是真的吗?我们人工验证了26个问题,结果出人意料
上一期,我们用一段500行真实生产环境的西门子S7-200 SMART STL代码,测试了4大AI的代码审查能力,共发现了26个疑似问题。

文章发出后,很多工程师在评论区留言:"AI说的这些bug真的会炸机吗?""有些问题看起来像是AI不懂工业逻辑的误判!""能不能人工验证一下,哪些是真问题,哪些是瞎扯?"
为了给大家一个最准确的答案,我们逐行人工比对了这段代码,并结合实际设备运行逻辑,对所有问题进行了逐一验证。
结果确实出人意料:超过30%的"bug"其实是AI的误判,有些甚至是工业程序中非常常见的设计手法。
📋 人工验证说明
本次验证严格遵循工业现场标准,将所有问题分为四个等级:
✅ 真问题:确实存在逻辑错误,会导致设备异常或功能失效
⚠️ 优化建议:不影响设备正常运行,但可以提升代码可读性或可维护性
❌ 误判:AI对工业逻辑理解错误,问题本身不存在
🟡 有瑕疵:AI的判断部分正确,但存在细节偏差
验证原则:
以实际PLC编译运行结果为准
结合工业现场的常见设计习惯
区分"逻辑错误"和"设计选择"
不追求完美代码,只关注是否影响生产
🔍 三大AI平台问题人工验证结果
3.1 某文心:3个真问题,1个完全误判
| 原AI提出的问题 | 人工验证结果 | 详细说明 |
|---|---|---|
某文心验证小结:对最明显的语法错误和简单冗余识别准确,但对STL代码的生成逻辑和工业程序的常见设计手法了解不足,存在数据类型相关的误判。
3.2 某千:0个致命bug,全是优化建议或误判
| 原AI提出的问题 | 人工验证结果 | 详细说明 |
|---|---|---|
某千验证小结:没有发现任何真正的逻辑错误。擅长从代码结构角度提出优化建议,但对工业控制的实际工艺和安全规范理解严重不足,容易将正常的设计选择误判为bug。
3.3 某Deep:7个真问题,1个有瑕疵,1个优化建议,0个误判
| 原AI提出的问题 | 人工验证结果 | 详细说明 |
|---|---|---|
某Deep验证小结:是三个平台中发现真问题最多的。对硬逻辑错误的识别能力较强,几乎没有误判,但对特定PLC平台的细节限制了解不足,存在个别判断有瑕疵的情况。
📊 三大AI平台验证结果多维度对比
统一基准说明
本次验证共确认7个独立真问题,所有指标均基于此统一基准计算,确保对比公平性。
| 对比维度 | 某Deep | 某文心 | 某千 |
|---|---|---|---|
本次验证核心发现:
不同AI的能力差异巨大,真问题发现率从0%到100%不等
所有AI都存在不同程度的局限性,没有一个平台能做到完美
AI最擅长找"语法错误"和"硬逻辑错误"
AI最不擅长理解"工艺设计"和"特定平台特性"

💬 互动时间
你被AI误判过吗?有没有遇到过AI说有bug,但实际运行完全正常的情况?欢迎在评论区分享你的经历,点赞最高的3位,我们将免费送出一份《AI审PLC代码避坑指南》。
📢 下期预告:某豆的14个问题全验证
本期我们验证了某文心、某千、某Deep三个平台的18个问题,某豆提出的14个问题(包括5个被判定为"致命级"的bug)我们将在下一期进行最详细的验证。
我们会把这段代码下载到真实的S7-200 SMART PLC中,逐一触发每一个疑似bug,用实际运行结果告诉你:
那个被某豆判定为"会让气缸1ms疯狂动作"的定时器bug,到底有多可怕?
某豆发现的其他9个问题,哪些是真的,哪些是误判?
为什么某豆能发现其他AI都看不到的问题?
关注我们,下期带你亲眼见证——AI审PLC代码的真实水平到底如何。

夜雨聆风