系列回顾:上一篇《供应链计划会开到半夜?我用AI Agent 3分钟搞定》发布后,不少朋友问:MVP 验证了可行性,但离真实业务还有多远?说实话,MVP 只是"能用"。真实业务中,原材料价格暴涨怎么办?天气不好需求会不会减少?预测模型参数谁来调?这篇文章记录了我用一个月时间,把 MVP 补强到43 个工具、10 大场景、多源信号融合、自适应学习的完整过程。
一、MVP 之后:五个"不够用"
MVP 上线后,我做了两周的真实场景测试。结果发现,6 个 Agent + 28 个工具 + 4 个场景,覆盖了供应链计划的"骨架",但离"血肉丰满"还差很远:
痛点 | 具体表现 |
看不到外部 | 铜价涨了 15%、台风要来了、港口拥堵了——系统完全无感 |
不会自己调 | 预测模型 alpha 固定 0.3,销量波动大时偏差高达 40%,系统不会自动调 |
只会单点干 | 用户说"做月度计划",Agent 不知道先查什么、后算什么 |
告警没下文 | "库存低于安全线"——然后呢?没有行动方案 |
供应商评分静态 | 半年更新一次评分表,远跟不上实际变化 |
这五个问题,本质上是一个问题:MVP 只解决了"信息获取"和"单点计算",没有解决"智能决策"和"持续进化"。
二、补强方向:三个"从...到..."

维度一:从"只看内部"到"内外融合"
上一篇提到,供应链计划最大的痛点之一是"信息分散"。MVP 解决了内部系统的数据拉通(销售、生产、库存、供应商),但忽略了另一类关键信息:外部环境信号。
我补强了三类外部数据源:
🌤️ 天气数据
覆盖 35 个中国主要城市
自动评估供应链影响:暴雨/台风 → HIGH,大风/高温 → MEDIUM
实际效果:"广州暴雨预警" → 自动触发物流风险评估 → 提前调整华南仓发货计划
📰 新闻舆情
接入 BBC Business + Reuters RSS
25 个供应链关键词过滤:supply chain、manufacturing、raw material、port、shortage...
自动提取 9 类供应链信号(需求、供应、物流、价格、天气、政策、舆情、质量、市场)
💰 金融指标
监控 8 大大宗商品:USD/CNY、铜、钢、原油、铝、橡胶、铁矿石
4 级采购成本影响评估
自动生成策略建议:"铜价近 30 天上涨 12%,建议增加铜材安全库存"
这三类数据不是简单"展示"给用户看,而是通过信号融合引擎统一量化后参与决策计算(后面详细讲)。
维度二:从"单点调用"到"端到端决策"
MVP 阶段,用户需要知道该调用哪个工具。比如"查库存"→ `read_inventory`,"跑预测"→ `generate_forecast`。
但真实场景不是这样的。用户说的是:
"帮我做下个月的供应链运营计划" "PROD-A001 客户紧急追加 5000 件,交期 5 天" "最近铜价波动较大,分析对我们供应链的影响"
这些是复合意图,需要多个工具协同完成。我补强了三层决策架构:
第一层:意图引擎(12 类意图自动识别)
用户说一句自然语言,系统自动识别意图:
用户说 | 识别意图 | 置信度 | 系统行为 |
"SKU001 下个月预测一下" | demand_forecast | 0.92 | ✅ 直接执行 |
"那个产品库存够不够" | inventory_check | 0.65 | ❓ 追问:"您说的是 PROD-A001 吗?" |
"最近铜价涨了对我们有什么影响" | supplier_evaluation | 0.88 | ✅ 直接执行 |
三级置信度路由:≥0.85 直接执行,0.60-0.85 追问补充,<0.60 降级为自由问答。
第二层:信号融合引擎(最有差异化价值的模块)
这是整个补强中最核心的设计。
传统系统处理信息的方式是"非此即彼"——要么有影响,要么没影响。但现实世界不是这样的。铜价涨了 5%,对某些物料影响大,对另一些几乎没影响;台风在广东,对华东仓没影响,但对华南仓影响很大。
我设计了9 种信号类型 × 5 级严重度 × 3 种融合策略的量化框架:

三种融合策略:
加权求和:适合综合评估("整体供应链健康度怎么样?")
最大严重度:适合风险预警("有没有需要立即处理的?")
多数投票:适合多源交叉验证("多个信号都说有问题,那大概率真有问题")
加上 7 天半衰期的时间衰减——昨天的信号比上周的信号更有参考价值。
第三层:执行引擎(风险分级审批)
行动方案不是简单执行,而是根据风险等级自动匹配审批策略:
风险等级 | 审批策略 | 适用场景 |
🟢 LOW | 自动审批 | 常规补货、参数微调 |
🟡 MEDIUM | 自动审批 | 单一物料替代、小幅排产调整 |
🟠 HIGH | 需要审批(60分钟超时升级) | 多物料替代、大批量采购 |
🔴 CRITICAL | 多人审批(≥2人同意) | 产线停机、供应商切换 |
支持执行跟踪、偏差计算和回滚——方案执行后,系统会自动对比"预期 vs 实际",为后续的自适应学习提供数据。
维度三:从"固定参数"到"越用越准"
这是传统供应链系统几乎没做过的。
MVP 的预测模型 alpha 值固定 0.3,安全库存服务水平固定 0.95。但现实是:销量稳定的 SKU 和波动大的 SKU,应该用不同的参数;旺季和淡季,参数也应该不同。
我补强了反馈学习闭环:

具体机制:
1.偏差采集:每次行动方案执行后,自动计算预测偏差(MAPE、Bias、RMSE)
2.根因分析:LLM 自动归因——数据质量问题?模型能力不足?外部环境变化?季节性波动?
3.参数自整定:
MAPE 上升 → 降低 alpha(预测更平滑,减少过度反应)
MAPE 下降 → 提升 alpha(预测更灵敏,捕捉趋势变化)
缺货率高 → 提升安全库存服务水平
过剩率高 → 降低安全库存服务水平
4.经验沉淀:每次决策和结果存入经验向量库,下次遇到类似情况可以检索复用
效果:系统运行越久,积累的反馈数据越多,预测精度和决策质量持续提升。这才是"AI Agent"和"规则引擎"最本质的区别。
三、工具函数:从 28 个到 43 个
上一篇提到 MVP 有 28 个工具函数。补强后扩展到 43 个,新增的 15 个工具集中在三个方向:
新增方向 | 工具 | 解决什么问题 |
外部数据接入 | fetch_external_data、extract_signals、batch_parse、fuse_signals | 天气/新闻/金融数据获取和信号融合 |
执行反馈 | submit_action_plan、approve_action、execute_action、track_execution、rollback_action、collect_feedback、analyze_deviations、auto_tune_model | 方案审批、执行跟踪、偏差分析、参数调优 |
智能调度 | manage_monitors、manage_event_triggers、emit_event | 定时巡检 + 事件驱动 |
完整的 43 个工具覆盖 10 大类别:
类别 | 数量 | 代表工具 |
📊 数据读取 | 5 | read_sales_data, read_bom, read_inventory |
🧮 计算分析 | 4 | generate_forecast, run_mrp, calculate_safety_stock |
⚠️ 约束管理 | 3 | check_constraints, check_material_availability |
🔄 替代管理 | 2 | find_substitute_material, find_substitute_bom |
🚨 异常监控 | 3 | scan_all_plans, generate_action_plan |
📋 通信协调 | 4 | dispatch_task, resolve_conflict |
✅ 数据校验 | 3 | validate_data, import_data |
🎯 意图理解 | 1 | parse_intent |
🌐 数据接入与信号 | 5 | fetch_external_data, fuse_signals |
🚀 执行与反馈 | 8 | execute_action, auto_tune_model |
⏰ 巡检管理 | 3 | manage_monitors, emit_event |
四、实测效果:10 个场景全覆盖
上一篇测试了 4 个场景。补强后,我测试了 10 个业务场景,覆盖供应链计划的全流程:
场景 1:月度 S&OP 计划(升级版)
输入:"帮我做下个月的供应链运营计划,包括需求预测、库存检查和产能评估"
与 MVP 的区别:
•MVP:需要分步指定每个 Agent 的任务
•补强后:一句话触发,系统自动并行调用 read_sales_data + read_inventory + read_capacity,然后串联 generate_forecast → generate_report

场景 2:紧急插单响应
输入:"客户紧急下单 PROD-A001 共 2000 件,交期 10 天,给出履约计划"
系统能力:
11个工具联动,从订单接收到履约计划全自动
BOM两层展开(FG→WIP→RM)自动识别物料需求
MRP计算净需求,结合替代料方案给出最优建议

场景 3:供应商风险预警
输入:"供应商 SUPPLIER-G 最近表现下滑,评估一下风险并给出应对方案"
系统能力:
不只是查静态评分,而是融合外部实时信号(新闻舆情)
结合库存和替代方案,给出完整的风险应对策略

场景 4:库存健康诊断(新增)
输入:"分析所有仓库的库存健康度,重点关注呆滞和缺货风险"
系统能力:
四维评估:覆盖率、周转率、呆滞率、缺货率
自动计算最优安全库存(Z值法)
给出具体的补货/降库建议

场景 5:新品导入验证(新增)
输入:"新品 PROD-X001 要导入,验证物料齐套和供应商情况"
系统能力:
新品导入前自动验证物料、替代、约束
提前识别断料风险,避免生产上线后才发现问题

场景 6:异常根因分析(增强版)
输入:"扫描当前计划异常,生成处理方案并跟踪执行效果"
系统能力:
自动根因分析 + 生成多套行动方案
按风险等级匹配审批策略(LOW自动执行,CRITICAL多人审批)
执行后自动跟踪偏差,形成反馈闭环

场景 7:采购决策支持
输入:"铜价近期上涨,分析对我们采购成本的影响,给出采购策略建议"
系统能力:
铜价上涨自动追溯BOM,找出受影响成品
结合供应商和替代方案,给出最优采购策略
支持锁价、替代、提前采购等多种策略

场景 8:多Agent协作
输入:"同时处理三个任务:月度计划、紧急插单、供应商评估,需要协调执行"
系统能力:
Orchestrator协调多个Worker Agent并行工作
通过黑板共享数据,通过dispatch_task分发任务
自动解决资源冲突(如两个任务同时需要同一产线)

场景 9:模型自适应(新增)
输入:"对比上月预测和实际销售,分析偏差原因并优化预测模型"
系统能力:
预测偏差自动收集和分析
自适应调优模型参数(调优幅度受限,防止震荡)
系统越用越准——这才是AI Agent和规则引擎的本质区别

场景 10:巡检自动报告(新增)
输入:"生成最新的供应链巡检报告,包含计划健康度、阈值告警和行动建议"
系统能力:
定时任务自动触发,也可以手动触发
自动扫描计划健康状态,对比阈值生成告警
自动生成报告,无需人工干预

五、双层调度:从"被动响应"到"主动感知"
除了用户主动发起对话,补强后的系统还内置了双层调度机制:
⏰ 定时巡检(4 个预设任务)
频率 | 任务 | 输出 |
每小时 | 计划异常扫描 | 飞书告警卡片 |
每天 09:00 | 需求预测偏差审查 | 偏差报告 |
每天 08:00 | 外部信号巡检 | 信号摘要 |
每周一 02:00 | 模型参数自动调优 | 调优日志 |
⚡ 事件触发(9 条预设规则)
基于发布-订阅的事件架构:
供应商风险信号 → 自动路由到采购 Agent
市场趋势信号 → 自动路由到需求 Agent
计划变更 → 自动触发一致性检查
效果:系统不需要等人来问,自己就能发现问题、分析问题、推送解决方案。
六、踩坑记录:补强过程中的 5 个坑
坑 1:uuid npm 包在容器中崩溃
现象:`uuid.v4()` 在 Docker 环境中触发 `ECONNREFUSED` 错误,MCP Server 启动就挂。
原因:uuid 包尝试读取 `/proc/sys/kernel/random/uuid`,容器环境中该路径不可用。
修复:替换为 Node.js 内置的 `crypto.randomUUID()`,零依赖。
坑 2:Node.js v25 的 Unicode 严格解析
现象:单引号字符串中的中文报 `SyntaxError`。
修复:统一使用双引号 + Unicode 转义序列。
坑 3:国内 RSS 源大面积 404
现象:新浪、财新的 RSS 源全部失效。
修复:切换到 BBC Business + Reuters,并添加 HTTPS_PROXY 代理支持。
坑 4:OpenClaw MCP 工具命名格式
现象:Agent 的 alsoAllow 配置了工具名,但 LLM 就是不调用。
原因:OpenClaw 的 MCP 工具注册名是 `mcp__server名__工具名`(双下划线),不是 `mcp:server名:工具名`(单冒号)。
修复:统一使用双下划线格式。这个坑排查了整整两天。
坑 5:LLM 不调用工具,走黑板分发
现象:用户说"查 BOM",LLM 不调用 `read_bom`,而是调用 `read_blackboard` 去读黑板数据。
原因:SOUL.md 中的架构描述让 LLM 误以为需要通过黑板间接获取数据。
修复:在 SOUL.md 中添加明确的"直接调用规则"和"禁止事项"。
七、技术架构对比:MVP vs 补强后
维度 | MVP(第一篇) | 补强后(本篇) |
工具函数 | 28 个 | 43 个 |
业务场景 | 4 个 | 10 个 |
数据来源 | 内部数据库 | 内部 + 天气 + 新闻 + 金融 |
决策模式 | 单工具调用 | 意图识别 → 信号融合 → 方案生成 → 审批执行 |
参数调优 | 固定参数 | 自适应闭环(越用越准) |
异常处理 | 告警 | 告警 + 根因分析 + 多套行动方案 + 审批执行 |
调度机制 | 仅用户触发 | 用户触发 + 定时巡检 + 事件驱动 |
自动化测试 | 未覆盖 | 78/78 用例通过 |
八、下一步规划
方向 | 内容 | 优先级 |
📊 可视化看板 | 供应链健康度仪表盘 | P1 |
🏢 多租户支持 | 按工厂/事业部隔离数据和配置 | P2 |
📱 移动端适配 | 飞书移动端交互优化 | P2 |
写在最后
上一篇发布后,有读者问我:"AI Agent 在供应链领域,最大的价值到底是什么?"
经过三个月的补强,我的答案更加清晰了:
不是替代人,而是让系统"越用越准"。
传统系统的参数是固定的,不管用多久都一样。但供应链是一个动态系统——供应商会变、市场会变、季节会变。一个能根据执行反馈自动调优的系统,才是真正的"智能"。
从 MVP 的 28 个工具到补强后的 43 个工具,从 4 个场景到 10 个场景,从固定参数到自适应学习——这个进化过程还在继续。
如果你也在做供应链相关的工作,或者对 AI Agent 在企业场景中的应用感兴趣,欢迎交流。
系列文章:
•📖 [第一篇:供应链计划会开到半夜?我用AI Agent 3分钟搞定]
•📖 [第二篇:供应链AI Agent进化录:从"能用"到"越用越准"(本文)]
演示地址:https://my.feishu.cn/file/KirAbxWAJoq78Vx07P6cT27Inkd
夜雨聆风