AI+工业场景落地系列10:工厂 Wi‑Fi 审计,不是测网速,是提前救 AGV 一命
车间里最吓人的,不一定是网络彻底断掉。
很多时候,AGV 不是一下子「没网了」,而是走到某个拐角,漫游慢了两秒,丢了几个包,控制指令开始发飘。现场的人看着像偶发故障,日志里也未必好看,最后一圈排查下来,锅经常又甩回设备本身。
但很多人搞反了。
工厂里的 Wi‑Fi 审计,重点不是看某个点测速有多高,而是把“哪里会掉、为什么掉、掉到什么程度”这件事,做成一张能看懂的地图。 你要抓的不是平均值,是死角、波动、漫游断层,还有那些平时不出事、一跑 AGV 就出事的边缘区。
这篇我就拆开讲,核心就三步。先把现场跑一遍,抓信号分布。再把链路和设备关系串起来。最后盯着 AGV 的实际路径,找那些“看起来有网,实际上不稳”的位置。地址先放这儿,Skydive 的项目在 GitHub 上,公开资料里是这个仓库,github。com/skydive-project/skydive。
先说一个常见误区
不少人做工厂无线排查,第一反应是拿手机站几个点测一下。
能不能连上。延迟高不高。下载速度行不行。
这么做不能说完全没用,但离“审计”差得很远。原因很简单,工厂网络的问题,本来就是空间问题和时间问题叠在一起的。
同一个 AP 覆盖区,上午空车间和下午设备全开,反射环境不一样。叉车经过金属货架边上,信号会抖。AGV 不是站着不动,它是移动终端,它会遇到漫游切换、短时衰减、邻频干扰。这些东西,靠静态测速看不出来。
我自己摸索了很久才搞明白,现场最难的不是“有没有信号”,而是“信号在移动过程中是不是连续可用”。
「工厂 Wi‑Fi 审计,本质上是在回答一个很具体的问题,设备从 A 点走到 B 点,中间有没有任何一小段,会让业务失去确定性。」
这话听着有点硬,但现场真就是这么残酷。AGV 不怕你网速慢一点,它怕的是不稳定。
第一步,先把“看不见”变成地图
这里有个关键动作,不要一上来盯设备日志,先做空间化。
你得先拿到一张厂区平面图,哪怕不是 CAD,简化示意图也行。把车间、货架、立柱、金属隔断、设备区、充电区、转弯点这些位置标出来。原因很现实,Wi‑Fi 在工厂里受遮挡和反射影响太大,没有空间底图,后面所有分析都容易飘。
然后去采集数据。
采什么,不复杂,主要盯这几类信息:
-
RSSI,也就是接收信号强度
-
SNR,信噪比
-
丢包和时延波动
-
终端漫游切换记录
-
AP 的位置、信道、功率、邻近关系
很多教程不会告诉你的是,信号强不等于可用。有些区域 RSSI 看着还行,但噪声高、重传多,AGV 一过去照样发愣。还有一些点,单次测试没问题,连续走十次会抖三次,这种才最烦。
Skydive 这类项目的价值,就在于它不是只给你一个“网通不通”的答案,它更适合把网络拓扑、链路状态、节点关系可视化。也就是说,你能把网络里哪些节点在通信、路径怎么走、哪里出现异常波动,慢慢串成一张关系图,而不是靠人脑硬记。
如果你现在就想开始,建议你先拿一条 AGV 常走路线试试,不用全厂铺开。先把一条最关键路径跑通。
第二步,不要只看覆盖,要看漫游断层
这一步没有捷径,大部分人卡在这一步。
工厂里最典型的问题,不是完全没覆盖,而是 AP 之间“看起来连上了,切换却不顺”。AGV 从 1 号库位跑到装配区,中间经过两个 AP 的边界地带,理论上信号都在,结果切换认证慢了、客户端犹豫了、或者两个 AP 功率配置不合理,设备就在边界上来回粘连。
结果呢,业务层看到的是短暂掉线。
这里有个常见误区,很多人会把 AP 功率直接拉高,觉得覆盖越强越安全。其实不是你想的那样。功率拉太高,覆盖重叠区变大,终端更容易“舍不得切”,该切的时候不切,拖到信号已经很差了才动,反而更容易掉。
所以审计时,你要看的不是单个 AP 强不强,而是:
-
AP 之间重叠区是不是合理
-
信道规划有没有互相打架
-
AGV 终端在移动时,切换发生在哪些位置
-
切换前后的时延、丢包有没有明显尖峰
这时候,Skydive 这种网络可视化能力就有用了。你可以把节点关系和流量路径拉出来,去看某一段链路是不是频繁重建,或者某些节点是不是总在异常状态附近晃。它不是专门做无线热力图的软件,这点我得先说清楚,但它很适合补上“网络行为可视化”这一块。很多现场问题,不是覆盖工具单独能解释完的。
热力图告诉你哪里弱,拓扑可视化告诉你弱了之后,网络到底怎么乱。
这两个要配着看。
第三步,审计一定要跟着业务路线走
不瞒你说,我以前也犯过一个很笨的错,拿着数据看了半天,图做得挺漂亮,现场还是照样报警。后来才发现,问题点根本不在我重点采样的位置,而是在 AGV 一个减速转弯的小路口。
所以我现在的做法是,审计不按建筑结构走,按业务路径走。
你得先问清楚几件事:
-
AGV 主要跑哪些固定路线
-
哪些路口会减速、转向、排队
-
哪些区域同时有多台车经过
-
哪些时段车间干扰最重
因为网络问题一旦落到业务上,往往不是平均分布的。故障总是集中在几个地方,拐角、门口、货架密集区、充电区入口,这些位置都特别容易出事。原因也不神秘,环境复杂、设备密集、切换频繁。
这一步里,建议你把采样结果做成一张“业务路线叠加信号图”。最好能一眼看出,AGV 从起点到终点,哪些路段是安全区,哪些路段只是勉强能跑,哪些路段应该直接判定为风险点。
「真正有用的审计报告,不是告诉领导“整体网络良好”,而是明确指出,2 号车间东南角转弯点存在漫游风险,建议调整 AP 功率和信道,复测 AGV 路径。」
这才叫能落地。
最后说一下,Skydive 该怎么用才不浪费
我不建议把它当成万能工具。
它更适合做的是,把复杂网络里的节点、连接、流量、状态,直观拉出来。你在工厂 Wi‑Fi 审计里,可以把它放在“网络关系可视化”和“异常路径观察”这个层面去用,尤其适合现场排查时补足盲区。无线覆盖测量、热力图绘制、终端侧漫游抓包,这些还是要配合专门工具一起做。
拆开来看其实不复杂,最实用的组合是这样:
-
先用现场采样把 RSSI、SNR、时延这些基础数据拿到
-
再把 AP、交换机、控制器、业务节点关系在 Skydive 里串起来
-
最后把 AGV 的实际路线压上去,去找“弱覆盖”和“异常链路行为”重叠的地方
一旦重叠了,问题基本就八九不离十。
工厂 Wi‑Fi 审计,难的从来不是工具安装,难的是你愿不愿意把现场走细。 金属货架后面那十米,转弯前那一下减速,交接区那一小段停留时间,这些脏活累活,软件不会替你做。急不来,这事儿得慢慢磨。
如果你现在要开始,我建议你今晚就试试第一步。别追求一步到位,先拿一条 AGV 路线,画出最粗的一版信号分布图,再把 github。com/skydive-project/skydive 跑起来,看看你的网络关系图到底长什么样。
很多问题,图一出来,人就不嘴硬了。
车走到拐角那一下,更是。
大家好,欢迎大家点赞关注~
夜雨聆风