
很多团队不是“不会用AI”,而是“没有可用的数据”。工具买回来,只是把问题照得更亮。
不少电商团队:采购了智能客服、AIGC详情、BI+大模型分析、甚至一整套“AI中台”。上线前大家兴奋,三周后群里安静。不是因为工具不行,而是项目一开始就踩进了同一个坑——数据准备不够。

3个最常见的“翻车现场”
这三种情况,你可能至少中过一种:
1)AIGC商品详情:生成得很快,但错得也很快。
标题里“真皮/PU”混着写、尺码表对不上、卖点抓不住;同一款SKU在不同系统里叫法不同,模型只能按“它看到的字”胡乱拼。结果运营要么不敢放,要么放了被用户追着骂。
2)智能客服:能聊天,但不解决问题。
客服机器人回答“看起来很像那么回事”,但一问到“这类商品能否七天无理由”“换货运费谁出”“活动价保怎么走”,就开始绕圈。根因通常不是模型能力,而是规则/知识散在表格、群公告、IM聊天、不同版本的SOP里,且没有结构化、没有版本号。

3)预测与决策:模型挺准,但业务不买账。
补货预测明明“误差不大”,但运营还是说“没用”。一追问才发现:促销日历没接进来、价格调整没同步、缺货导致的“销量为0”被当成需求下降,甚至不同人口中的“销量”口径都不一样(下单/支付/出库/签收)。模型做得再好,也是在用错误口径拟合。

问题不在AI:工具缺的是“可用数据”,不是“更多数据”
:::很多人听到“缺数据”,第一反应是“我们数据多得很:订单、广告、直播、仓储、客服……”。但AI要的不是“多”,而是“可用”。所谓可用,至少包含三件事:
•可对齐:同一个商品、同一个用户、同一笔订单,在不同系统里能对得上(ID能映射,口径能解释)。
•可相信:关键字段完整、及时、稳定,缺失有规则可补,异常有监控可追。
•可调用:权限清晰、脱敏策略明确、接口稳定,不是“问数据要一张表等两周”。
你会发现:很多“AI项目”,本质是在用AI把数据工程欠的债一次性催出来。
电商里最容易断的4条“数据链”
:::如果你想快速定位问题,建议从下面四条链路去排查:
•商品主数据链:类目/品牌/规格/材质/属性是否统一?SKU层级、套装/赠品关系是否清晰?
•交易事实链:下单→支付→出库→签收→售后各环节是否串得起来?退款/逆向订单口径是否统一?
•行为事件链:曝光→点击→加购→收藏→支付是否能闭环?事件命名、埋点版本、渠道维度是否一致?
•内容与规则链:客服SOP、价保规则、活动机制、质检标准是否结构化、可检索、可追溯版本?
这四条链不通,你买再贵的AI工具,也只能在断点附近“聪明地胡说”。

别再从“买工具”开始:从一个场景做出数据闭环
:::想让AI真正跑起来,我更推荐一个“反直觉”的顺序:先把业务动作定义清楚,再倒推数据。下面是电商团队常用的落地流程(不需要大改架构,关键是把路径走通):
Step 1:先写清楚“AI要替谁省哪一步”。
不要写“提升效率/降本增效”。写成一个可验收的动作:例如“把新品上架的标题+5点描述从40分钟压到10分钟,且合规错误率<1%”;或“把售后咨询首响自动解决率做到30%,无法解决的要给出准确的转人工理由与证据”。
Step 2:列“最小可用数据集”(MVD),只要够用就行。
以“生成商品卖点”为例,MVD可能只包含:类目、核心属性(材质/规格/型号)、历史成交关键词、差评TOP原因、竞品卖点(可公开抓取)、禁用词库。别一上来就要全量明细表,先把能闭环的字段凑齐。
Step 3:做一次“ID对齐+口径对齐”,别嫌麻烦。
电商AI最常见的三大主键是:用户ID、商品ID、订单ID。
你至少要有一张“映射表/主数据表”,说明这些ID来自哪里、如何更新、变化时怎么通知下游。否则模型今天用A系统的SKU,明天用B系统的SKU,输出自然不稳定。
Step 4:把数据质量变成指标,像盯GMV一样盯。
•完整率:关键字段缺失比例(如材质、尺码、发货时效)。
•一致性:同一字段在不同来源的冲突比例(如类目、品牌)。
•及时性:从业务发生到数据可用的延迟(分钟/小时/天)。
•漂移:近7天/30天字段分布是否突变(活动/换品/换系统常触发)。

Step 5:给数据加“合同”,让接口稳定下来。
数据合同并不复杂:字段定义、取值范围、更新时间、负责人、变更流程。你甚至可以先从一个飞书文档/Notion开始,但一定要让“改字段=改产品”,否则AI效果会像抽奖。
Step 6:上线别一刀切,灰度+人工兜底才是常态。
把AI当成“新同事”:先在低风险SKU/低峰时段灰度;每周复盘“错在哪个数据字段/哪个口径”;把纠错动作回写到数据资产里。这样你会越用越稳,而不是越用越怕。
买AI工具前,先问自己这5个问题(很现实,但能救命)
:::• 我这次要解决的,是“内容生产/客服问答/预测决策/分析洞察”哪一类?验收指标是什么?
• 这个场景的最小可用数据集是什么?现在能在1周内拿到吗?
• 关键口径(销量/退款/毛利/转化)有没有统一定义?谁拍板?
• 数据权限和合规怎么做?能否脱敏、能否审计、能否回溯?
• 上线后谁负责持续维护:数据、业务、还是供应商?预算里有没有预留“数据工程”的钱?
如果这5个问题答不上来,十有八九不是“工具买错了”,而是“顺序错了”。先把数据这条路修通,再上AI,效果会完全不同。
◇ ◆ ◇
夜雨聆风