乐于分享
好东西不私藏

AI+工业场景落地系列10:工厂 Wi‑Fi 审计,不是测网速,是提前救 AGV 一命

AI+工业场景落地系列10:工厂 Wi‑Fi 审计,不是测网速,是提前救 AGV 一命

车间里最吓人的,不一定是网络彻底断掉。

很多时候,AGV 不是一下子「没网了」,而是走到某个拐角,漫游慢了两秒,丢了几个包,控制指令开始发飘。现场的人看着像偶发故障,日志里也未必好看,最后一圈排查下来,锅经常又甩回设备本身。

但很多人搞反了。

工厂里的 Wi‑Fi 审计,重点不是看某个点测速有多高,而是把“哪里会掉、为什么掉、掉到什么程度”这件事,做成一张能看懂的地图。 你要抓的不是平均值,是死角、波动、漫游断层,还有那些平时不出事、一跑 AGV 就出事的边缘区。

这篇我就拆开讲,核心就三步。先把现场跑一遍,抓信号分布。再把链路和设备关系串起来。最后盯着 AGV 的实际路径,找那些“看起来有网,实际上不稳”的位置。地址先放这儿,Skydive 的项目在 GitHub 上,公开资料里是这个仓库,github。com/skydive-project/skydive

先说一个常见误区

不少人做工厂无线排查,第一反应是拿手机站几个点测一下。

能不能连上。延迟高不高。下载速度行不行。

这么做不能说完全没用,但离“审计”差得很远。原因很简单,工厂网络的问题,本来就是空间问题和时间问题叠在一起的。

同一个 AP 覆盖区,上午空车间和下午设备全开,反射环境不一样。叉车经过金属货架边上,信号会抖。AGV 不是站着不动,它是移动终端,它会遇到漫游切换、短时衰减、邻频干扰。这些东西,靠静态测速看不出来。

我自己摸索了很久才搞明白,现场最难的不是“有没有信号”,而是“信号在移动过程中是不是连续可用”。

工厂 Wi‑Fi 审计,本质上是在回答一个很具体的问题,设备从 A 点走到 B 点,中间有没有任何一小段,会让业务失去确定性。

这话听着有点硬,但现场真就是这么残酷。AGV 不怕你网速慢一点,它怕的是不稳定。

第一步,先把“看不见”变成地图

这里有个关键动作,不要一上来盯设备日志,先做空间化。

你得先拿到一张厂区平面图,哪怕不是 CAD,简化示意图也行。把车间、货架、立柱、金属隔断、设备区、充电区、转弯点这些位置标出来。原因很现实,Wi‑Fi 在工厂里受遮挡和反射影响太大,没有空间底图,后面所有分析都容易飘。

然后去采集数据。

采什么,不复杂,主要盯这几类信息:

  • RSSI,也就是接收信号强度

  • SNR,信噪比

  • 丢包和时延波动

  • 终端漫游切换记录

  • AP 的位置、信道、功率、邻近关系

很多教程不会告诉你的是,信号强不等于可用。有些区域 RSSI 看着还行,但噪声高、重传多,AGV 一过去照样发愣。还有一些点,单次测试没问题,连续走十次会抖三次,这种才最烦。

Skydive 这类项目的价值,就在于它不是只给你一个“网通不通”的答案,它更适合把网络拓扑、链路状态、节点关系可视化。也就是说,你能把网络里哪些节点在通信、路径怎么走、哪里出现异常波动,慢慢串成一张关系图,而不是靠人脑硬记。

如果你现在就想开始,建议你先拿一条 AGV 常走路线试试,不用全厂铺开。先把一条最关键路径跑通。

第二步,不要只看覆盖,要看漫游断层

这一步没有捷径,大部分人卡在这一步。

工厂里最典型的问题,不是完全没覆盖,而是 AP 之间“看起来连上了,切换却不顺”。AGV 从 1 号库位跑到装配区,中间经过两个 AP 的边界地带,理论上信号都在,结果切换认证慢了、客户端犹豫了、或者两个 AP 功率配置不合理,设备就在边界上来回粘连。

结果呢,业务层看到的是短暂掉线。

这里有个常见误区,很多人会把 AP 功率直接拉高,觉得覆盖越强越安全。其实不是你想的那样。功率拉太高,覆盖重叠区变大,终端更容易“舍不得切”,该切的时候不切,拖到信号已经很差了才动,反而更容易掉。

所以审计时,你要看的不是单个 AP 强不强,而是:

  • AP 之间重叠区是不是合理

  • 信道规划有没有互相打架

  • AGV 终端在移动时,切换发生在哪些位置

  • 切换前后的时延、丢包有没有明显尖峰

这时候,Skydive 这种网络可视化能力就有用了。你可以把节点关系和流量路径拉出来,去看某一段链路是不是频繁重建,或者某些节点是不是总在异常状态附近晃。它不是专门做无线热力图的软件,这点我得先说清楚,但它很适合补上“网络行为可视化”这一块。很多现场问题,不是覆盖工具单独能解释完的。

热力图告诉你哪里弱,拓扑可视化告诉你弱了之后,网络到底怎么乱。

这两个要配着看。

第三步,审计一定要跟着业务路线走

不瞒你说,我以前也犯过一个很笨的错,拿着数据看了半天,图做得挺漂亮,现场还是照样报警。后来才发现,问题点根本不在我重点采样的位置,而是在 AGV 一个减速转弯的小路口。

所以我现在的做法是,审计不按建筑结构走,按业务路径走。

你得先问清楚几件事:

  • AGV 主要跑哪些固定路线

  • 哪些路口会减速、转向、排队

  • 哪些区域同时有多台车经过

  • 哪些时段车间干扰最重

因为网络问题一旦落到业务上,往往不是平均分布的。故障总是集中在几个地方,拐角、门口、货架密集区、充电区入口,这些位置都特别容易出事。原因也不神秘,环境复杂、设备密集、切换频繁。

这一步里,建议你把采样结果做成一张“业务路线叠加信号图”。最好能一眼看出,AGV 从起点到终点,哪些路段是安全区,哪些路段只是勉强能跑,哪些路段应该直接判定为风险点。

真正有用的审计报告,不是告诉领导“整体网络良好”,而是明确指出,2 号车间东南角转弯点存在漫游风险,建议调整 AP 功率和信道,复测 AGV 路径。

这才叫能落地。

最后说一下,Skydive 该怎么用才不浪费

我不建议把它当成万能工具。

它更适合做的是,把复杂网络里的节点、连接、流量、状态,直观拉出来。你在工厂 Wi‑Fi 审计里,可以把它放在“网络关系可视化”和“异常路径观察”这个层面去用,尤其适合现场排查时补足盲区。无线覆盖测量、热力图绘制、终端侧漫游抓包,这些还是要配合专门工具一起做。

拆开来看其实不复杂,最实用的组合是这样:

  1. 先用现场采样把 RSSI、SNR、时延这些基础数据拿到

  2. 再把 AP、交换机、控制器、业务节点关系在 Skydive 里串起来

  3. 最后把 AGV 的实际路线压上去,去找“弱覆盖”和“异常链路行为”重叠的地方

一旦重叠了,问题基本就八九不离十。

工厂 Wi‑Fi 审计,难的从来不是工具安装,难的是你愿不愿意把现场走细。 金属货架后面那十米,转弯前那一下减速,交接区那一小段停留时间,这些脏活累活,软件不会替你做。急不来,这事儿得慢慢磨。

如果你现在要开始,我建议你今晚就试试第一步。别追求一步到位,先拿一条 AGV 路线,画出最粗的一版信号分布图,再把 github。com/skydive-project/skydive 跑起来,看看你的网络关系图到底长什么样。

很多问题,图一出来,人就不嘴硬了。

车走到拐角那一下,更是。

大家好,欢迎大家点赞关注~