供应链AI Agent进化录:制造业还在用Excel排产?我用AI做了个会学习的供应链大脑

#AIAgent #供应链数字化 #AI转型 #智能排产 #mrp #S&OP#库存优化 #供应链智能体 #企业AI落地

系列回顾：上一篇《供应链计划会开到半夜？我用AI Agent 3分钟搞定》发布后，不少朋友问：MVP 验证了可行性，但离真实业务还有多远？说实话，MVP 只是"能用"。真实业务中，原材料价格暴涨怎么办？天气不好需求会不会减少？预测模型参数谁来调？这篇文章记录了我用一个月时间，把 MVP 补强到43 个工具、10 大场景、多源信号融合、自适应学习的完整过程。

一、MVP 之后：五个"不够用"

MVP 上线后，我做了两周的真实场景测试。结果发现，6 个 Agent + 28 个工具 + 4 个场景，覆盖了供应链计划的"骨架"，但离"血肉丰满"还差很远：

痛点	具体表现
看不到外部	铜价涨了 15%、台风要来了、港口拥堵了——系统完全无感
不会自己调	预测模型 alpha 固定 0.3，销量波动大时偏差高达 40%，系统不会自动调
只会单点干	用户说"做月度计划"，Agent 不知道先查什么、后算什么
告警没下文	"库存低于安全线"——然后呢？没有行动方案
供应商评分静态	半年更新一次评分表，远跟不上实际变化

这五个问题，本质上是一个问题：MVP 只解决了"信息获取"和"单点计算"，没有解决"智能决策"和"持续进化"。

二、补强方向：三个"从...到..."

维度一：从"只看内部"到"内外融合"

上一篇提到，供应链计划最大的痛点之一是"信息分散"。MVP 解决了内部系统的数据拉通（销售、生产、库存、供应商），但忽略了另一类关键信息：外部环境信号。

我补强了三类外部数据源：

🌤️ 天气数据

覆盖 35 个中国主要城市

自动评估供应链影响：暴雨/台风 → HIGH，大风/高温 → MEDIUM

实际效果："广州暴雨预警" → 自动触发物流风险评估 → 提前调整华南仓发货计划

📰 新闻舆情

接入 BBC Business + Reuters RSS

25 个供应链关键词过滤：supply chain、manufacturing、raw material、port、shortage...

自动提取 9 类供应链信号（需求、供应、物流、价格、天气、政策、舆情、质量、市场）

💰 金融指标

监控 8 大大宗商品：USD/CNY、铜、钢、原油、铝、橡胶、铁矿石

4 级采购成本影响评估

自动生成策略建议："铜价近 30 天上涨 12%，建议增加铜材安全库存"

这三类数据不是简单"展示"给用户看，而是通过信号融合引擎统一量化后参与决策计算（后面详细讲）。

维度二：从"单点调用"到"端到端决策"

MVP 阶段，用户需要知道该调用哪个工具。比如"查库存"→ `read_inventory`，"跑预测"→ `generate_forecast`。

但真实场景不是这样的。用户说的是：

"帮我做下个月的供应链运营计划" "PROD-A001 客户紧急追加 5000 件，交期 5 天" "最近铜价波动较大，分析对我们供应链的影响"

这些是复合意图，需要多个工具协同完成。我补强了三层决策架构：

第一层：意图引擎（12 类意图自动识别）

用户说一句自然语言，系统自动识别意图：

用户说	识别意图	置信度	系统行为
"SKU001 下个月预测一下"	demand_forecast	0.92	✅ 直接执行
"那个产品库存够不够"	inventory_check	0.65	❓ 追问："您说的是 PROD-A001 吗？"
"最近铜价涨了对我们有什么影响"	supplier_evaluation	0.88	✅ 直接执行

三级置信度路由：≥0.85 直接执行，0.60-0.85 追问补充，<0.60 降级为自由问答。

第二层：信号融合引擎（最有差异化价值的模块）

这是整个补强中最核心的设计。

传统系统处理信息的方式是"非此即彼"——要么有影响，要么没影响。但现实世界不是这样的。铜价涨了 5%，对某些物料影响大，对另一些几乎没影响；台风在广东，对华东仓没影响，但对华南仓影响很大。

我设计了9 种信号类型 × 5 级严重度 × 3 种融合策略的量化框架：

三种融合策略：

加权求和：适合综合评估（"整体供应链健康度怎么样？"）

最大严重度：适合风险预警（"有没有需要立即处理的？"）

多数投票：适合多源交叉验证（"多个信号都说有问题，那大概率真有问题"）

加上 7 天半衰期的时间衰减——昨天的信号比上周的信号更有参考价值。

第三层：执行引擎（风险分级审批）

行动方案不是简单执行，而是根据风险等级自动匹配审批策略：

风险等级	审批策略	适用场景
🟢 LOW	自动审批	常规补货、参数微调
🟡 MEDIUM	自动审批	单一物料替代、小幅排产调整
🟠 HIGH	需要审批（60分钟超时升级）	多物料替代、大批量采购
🔴 CRITICAL	多人审批（≥2人同意）	产线停机、供应商切换

支持执行跟踪、偏差计算和回滚——方案执行后，系统会自动对比"预期 vs 实际"，为后续的自适应学习提供数据。

维度三：从"固定参数"到"越用越准"

这是传统供应链系统几乎没做过的。

MVP 的预测模型 alpha 值固定 0.3，安全库存服务水平固定 0.95。但现实是：销量稳定的 SKU 和波动大的 SKU，应该用不同的参数；旺季和淡季，参数也应该不同。

我补强了反馈学习闭环：

具体机制：

1.偏差采集：每次行动方案执行后，自动计算预测偏差（MAPE、Bias、RMSE）

2.根因分析：LLM 自动归因——数据质量问题？模型能力不足？外部环境变化？季节性波动？

3.参数自整定：

MAPE 上升 → 降低 alpha（预测更平滑，减少过度反应）

MAPE 下降 → 提升 alpha（预测更灵敏，捕捉趋势变化）

缺货率高 → 提升安全库存服务水平

过剩率高 → 降低安全库存服务水平

4.经验沉淀：每次决策和结果存入经验向量库，下次遇到类似情况可以检索复用

效果：系统运行越久，积累的反馈数据越多，预测精度和决策质量持续提升。这才是"AI Agent"和"规则引擎"最本质的区别。

三、工具函数：从 28 个到 43 个

上一篇提到 MVP 有 28 个工具函数。补强后扩展到 43 个，新增的 15 个工具集中在三个方向：

新增方向	工具	解决什么问题
外部数据接入	fetch_external_data、extract_signals、batch_parse、fuse_signals	天气/新闻/金融数据获取和信号融合
执行反馈	submit_action_plan、approve_action、execute_action、track_execution、rollback_action、collect_feedback、analyze_deviations、auto_tune_model	方案审批、执行跟踪、偏差分析、参数调优
智能调度	manage_monitors、manage_event_triggers、emit_event	定时巡检 + 事件驱动

完整的 43 个工具覆盖 10 大类别：

类别	数量	代表工具
📊 数据读取	5	read_sales_data, read_bom, read_inventory
🧮 计算分析	4	generate_forecast, run_mrp, calculate_safety_stock
⚠️ 约束管理	3	check_constraints, check_material_availability
🔄 替代管理	2	find_substitute_material, find_substitute_bom
🚨 异常监控	3	scan_all_plans, generate_action_plan
📋 通信协调	4	dispatch_task, resolve_conflict
✅ 数据校验	3	validate_data, import_data
🎯 意图理解	1	parse_intent
🌐 数据接入与信号	5	fetch_external_data, fuse_signals
🚀 执行与反馈	8	execute_action, auto_tune_model
⏰ 巡检管理	3	manage_monitors, emit_event

四、实测效果：10 个场景全覆盖

上一篇测试了 4 个场景。补强后，我测试了 10 个业务场景，覆盖供应链计划的全流程：

场景 1：月度 S&OP 计划（升级版）

输入："帮我做下个月的供应链运营计划，包括需求预测、库存检查和产能评估"

与 MVP 的区别：

•MVP：需要分步指定每个 Agent 的任务

•补强后：一句话触发，系统自动并行调用 read_sales_data + read_inventory + read_capacity，然后串联 generate_forecast → generate_report

场景 2：紧急插单响应

输入："客户紧急下单 PROD-A001 共 2000 件，交期 10 天，给出履约计划"

系统能力：

11个工具联动，从订单接收到履约计划全自动

BOM两层展开（FG→WIP→RM）自动识别物料需求

MRP计算净需求，结合替代料方案给出最优建议

场景 3：供应商风险预警

输入："供应商 SUPPLIER-G 最近表现下滑，评估一下风险并给出应对方案"

系统能力：

不只是查静态评分，而是融合外部实时信号（新闻舆情）

结合库存和替代方案，给出完整的风险应对策略

场景 4：库存健康诊断（新增）

输入："分析所有仓库的库存健康度，重点关注呆滞和缺货风险"

系统能力：

四维评估：覆盖率、周转率、呆滞率、缺货率

自动计算最优安全库存（Z值法）

给出具体的补货/降库建议

场景 5：新品导入验证（新增）

输入："新品 PROD-X001 要导入，验证物料齐套和供应商情况"

系统能力：

新品导入前自动验证物料、替代、约束

提前识别断料风险，避免生产上线后才发现问题

场景 6：异常根因分析（增强版）

输入："扫描当前计划异常，生成处理方案并跟踪执行效果"

系统能力：

自动根因分析 + 生成多套行动方案

按风险等级匹配审批策略（LOW自动执行，CRITICAL多人审批）

执行后自动跟踪偏差，形成反馈闭环

场景 7：采购决策支持

输入："铜价近期上涨，分析对我们采购成本的影响，给出采购策略建议"

系统能力：

铜价上涨自动追溯BOM，找出受影响成品

结合供应商和替代方案，给出最优采购策略

支持锁价、替代、提前采购等多种策略

场景 8：多Agent协作

输入："同时处理三个任务：月度计划、紧急插单、供应商评估，需要协调执行"

系统能力：

Orchestrator协调多个Worker Agent并行工作

通过黑板共享数据，通过dispatch_task分发任务

自动解决资源冲突（如两个任务同时需要同一产线）

场景 9：模型自适应（新增）

输入："对比上月预测和实际销售，分析偏差原因并优化预测模型"

系统能力：

预测偏差自动收集和分析

自适应调优模型参数（调优幅度受限，防止震荡）

系统越用越准——这才是AI Agent和规则引擎的本质区别

场景 10：巡检自动报告（新增）

输入："生成最新的供应链巡检报告，包含计划健康度、阈值告警和行动建议"

系统能力：

定时任务自动触发，也可以手动触发

自动扫描计划健康状态，对比阈值生成告警

自动生成报告，无需人工干预

五、双层调度：从"被动响应"到"主动感知"

除了用户主动发起对话，补强后的系统还内置了双层调度机制：

⏰ 定时巡检（4 个预设任务）

频率	任务	输出
每小时	计划异常扫描	飞书告警卡片
每天 09:00	需求预测偏差审查	偏差报告
每天 08:00	外部信号巡检	信号摘要
每周一 02:00	模型参数自动调优	调优日志

⚡ 事件触发（9 条预设规则）

基于发布-订阅的事件架构：

供应商风险信号 → 自动路由到采购 Agent

市场趋势信号 → 自动路由到需求 Agent

计划变更 → 自动触发一致性检查

效果：系统不需要等人来问，自己就能发现问题、分析问题、推送解决方案。

六、踩坑记录：补强过程中的 5 个坑

坑 1：uuid npm 包在容器中崩溃

现象：`uuid.v4()` 在 Docker 环境中触发 `ECONNREFUSED` 错误，MCP Server 启动就挂。

原因：uuid 包尝试读取 `/proc/sys/kernel/random/uuid`，容器环境中该路径不可用。

修复：替换为 Node.js 内置的 `crypto.randomUUID()`，零依赖。

坑 2：Node.js v25 的 Unicode 严格解析

现象：单引号字符串中的中文报 `SyntaxError`。

修复：统一使用双引号 + Unicode 转义序列。

坑 3：国内 RSS 源大面积 404

现象：新浪、财新的 RSS 源全部失效。

修复：切换到 BBC Business + Reuters，并添加 HTTPS_PROXY 代理支持。

坑 4：OpenClaw MCP 工具命名格式

现象：Agent 的 alsoAllow 配置了工具名，但 LLM 就是不调用。

原因：OpenClaw 的 MCP 工具注册名是 `mcp__server名__工具名`（双下划线），不是 `mcp:server名:工具名`（单冒号）。

修复：统一使用双下划线格式。这个坑排查了整整两天。

坑 5：LLM 不调用工具，走黑板分发

现象：用户说"查 BOM"，LLM 不调用 `read_bom`，而是调用 `read_blackboard` 去读黑板数据。

原因：SOUL.md 中的架构描述让 LLM 误以为需要通过黑板间接获取数据。

修复：在 SOUL.md 中添加明确的"直接调用规则"和"禁止事项"。

七、技术架构对比：MVP vs 补强后

维度	MVP（第一篇）	补强后（本篇）
工具函数	28 个	43 个
业务场景	4 个	10 个
数据来源	内部数据库	内部 + 天气 + 新闻 + 金融
决策模式	单工具调用	意图识别 → 信号融合 → 方案生成 → 审批执行
参数调优	固定参数	自适应闭环（越用越准）
异常处理	告警	告警 + 根因分析 + 多套行动方案 + 审批执行
调度机制	仅用户触发	用户触发 + 定时巡检 + 事件驱动
自动化测试	未覆盖	78/78 用例通过

八、下一步规划

方向	内容	优先级
📊 可视化看板	供应链健康度仪表盘	P1
🏢 多租户支持	按工厂/事业部隔离数据和配置	P2
📱 移动端适配	飞书移动端交互优化	P2

写在最后

上一篇发布后，有读者问我："AI Agent 在供应链领域，最大的价值到底是什么？"

经过三个月的补强，我的答案更加清晰了：

不是替代人，而是让系统"越用越准"。

传统系统的参数是固定的，不管用多久都一样。但供应链是一个动态系统——供应商会变、市场会变、季节会变。一个能根据执行反馈自动调优的系统，才是真正的"智能"。

从 MVP 的 28 个工具到补强后的 43 个工具，从 4 个场景到 10 个场景，从固定参数到自适应学习——这个进化过程还在继续。

如果你也在做供应链相关的工作，或者对 AI Agent 在企业场景中的应用感兴趣，欢迎交流。

如果你也想测测你的供应链AI化潜力有多大？关注我，私信发送3个月数据，我可以帮免费做一次场景分析，告诉我你工厂最头疼的3个问题，我帮你算算——AI该怎么在你的工厂里落地，限前5名。

系列文章：

•📖 [第一篇：供应链计划会开到半夜？我用AI Agent 3分钟搞定]

•📖 [第二篇：供应链AI Agent进化录：从"能用"到"越用越准"（本文）]

演示地址：https://my.feishu.cn/file/KirAbxWAJoq78Vx07P6cT27Inkd