从生产稳定角度,AI企业应用的一些基础工作

很多企业兴致勃勃地上了AI项目，花了几个月时间，投入了不少钱。上线时，老板很高兴，觉得终于赶上了时代的列车。可过了两三个星期，就不怎么用了。为什么？日常生活工作AI可以给些帮助，但到了正事上，有时AI给出的建议不准，有时数据更新不及时，更有进用起来比原来还麻烦。最后，系统就安安静静地躺在服务器里了，没人提起，也没人敢问。其实不是AI不行，是在做AI落地之前，有一些基础工作没做扎实。AI在企业里要稳定运行，能持续创造价值，得先把这几件事想清楚。

一、需求确认：别把“想要”当成“需要”

很多企业的AI项目，起步就歪了。怎么歪的？老板看了几个短视频，或听了次课，觉得AI很厉害，然后跟技术说：“我们也要搞一个。”技术问：“搞什么？”老板讲不明白，但表达的意思挺清楚：“你自己看，反正要AI。”有点像去看病，跟医生说“给我开点药”，但不说哪儿不舒服。医生不惯着你，但技术或乙方，就只好猜测着来满足你。

AI落地也一样，第一步不是选模型、不是搭系统，是坐下来，安安静静地问自己一个问题：到底要解决什么具体的、可描述的痛点？

比如有家企业想用AI做智能客服。理由是“客户咨询太多了，客服忙不过来”。听起来很合理。但真的坐下来一分析，发现客户咨询里有一半是物流查询，问“我的货到哪了”。这个问题，其实把订单系统跟物流系统打通，做一个自动查询入口就能解决，根本用不到AI。剩下的一半，才是真正的产品问题、售后问题。这时就不需要做大而全的智能客服，只需要把物流查询做成自助。

需求确认的意义就是这样。并不是所有问题都需要AI，也不是AI能解决所有问题。你得先分清楚，哪些是规则问题，哪些是经验问题，哪些是真正需要智能判断的问题。

规则问题，比如“满多少减多少”“什么时候发货”，写清楚逻辑，让系统自动执行就行，没必要让AI来学。经验问题，比如“这个客户语气很急，可能需要优先处理”，这种靠人凭感觉判断的，才是AI能学的地方。

还有一点容易踩坑：需求要说得具体。不能说“提高客服效率”，太模糊。要说“把客户工单从分类到分配的时间，从平均十分钟压缩到两分钟”。有这个具体数字，后面你才知道成没成功。

需求确认做完，还有一个动作不能省：排优先级。企业里痛点很多，时间、预算、人力都有限。别想着一次解决所有问题，挑一个最疼的、回报最明确的，先做。做成一个，大家有了信心，再做第二个。

二、数据是AI的粮食

如果说AI是一辆车，数据就是油。油不好，车跑不起来。油不够，车跑不远。

很多企业的数据情况，让人头疼。数据散落在各个系统里，CRM一套、ERP一套、Excel又一堆。同一个客户，在这叫“张三科技有限公司”，在那叫“张三科技”，还有的叫“张总”。这些脏数据喂给AI，它学不会准确地判断。

所以，数据工作的第一步，是采集，采集或收集相关的数据。

第二步是清洗。把重复的去掉，把格式统一，把明显的错误修正。这个过程很枯燥，也没什么技术含量，但绕不过去。就像一个厨师，炒菜之前得洗菜、切菜，不能不洗直接用。

清洗完之后，是标注。这是更费功夫的活。比如说，你要训练一个AI来识别客户的投诉类型。你得先把历史的一千份工单拿出来，人工给每一条打标签：这个是“产品质量”，那个是“物流延迟”，还有一个是“客服态度”。AI就是从这些打好的标签里学习规律。标注的质量，直接决定了AI学出来的水平。

有人说，这些活能不能让AI自己干？可以，但那是在你已经有一个基础模型之后。最开始的那批训练数据，必须人工标注，没有捷径。

还有一点容易被忽略：数据的管理和更新。很多企业的数据是静态的。去年整理了一批，今年还拿那批来用。可是业务在变，客户在变，产品在变。去年标注的“产品质量”投诉，可能今年产品升级了，那个问题已经不存在了。如果你不更新数据，AI就会一直停留在过去的认知里。

定期审视数据，定期补充新的数据，定期淘汰过时的数据。这件事，要有人专门负责。可以是一个人，也可以是一个小团队，但不能没人管。

除了内部数据，有时候还需要外部数据。比如做竞品分析，就不能只看自己家的数据，还得去爬公开的信息。这些外部数据的获取、清洗、更新，又是一套活。但原则是一样的：干净、够吃、能持续。

三、模型的选择和训练：别追新，要追稳

模型这个词，听起来很技术，其实可以理解成“AI的大脑”。市面上有各种各样的模型，开源的、闭源的，大的、小的，通用的、垂直的。怎么选？

原则很简单：够用就行，不追新、不追大。

很多企业容易犯一个错误，觉得自己要做AI，就得用最厉害的模型。GPT-4出来了，赶紧用；Claude3出来了，又换。花了很多精力在切换模型上，却没花精力在数据上。

其实，模型的选择，应该反过来：先看你的数据量有多少，再看你的场景需要什么能力，最后才选模型。数据量小，就别用大模型，小模型就够了，跑得还快。场景简单，比如只是做个文本分类，就没必要用那种能写诗能编程的通用大模型，杀鸡用不着牛刀。

选好了模型，接下来是训练。训练不是一次性的事，是持续的过程。第一次训练，让AI学会基础能力。上线之后，根据实际运行情况，不断用新的数据去微调、去优化。就像一个人，上学是基础教育，工作是持续学习。AI也一样。

还有一点很重要：监控。AI上线之后，得有人盯着它跑得怎么样。给出的建议准不准？用户满不满意？有没有出现明显的错误？这些问题，不能等用户投诉了才知道，要主动监控、主动发现、主动修正。

监控的方式可以很简单。比如，每周随机抽一百条AI的处理结果，人工复核一遍，看看准确率是多少。如果准确率下降了，就要去找原因：是数据出了问题，还是场景变了，还是模型需要重新训练。

最后，说一个容易被忽视的细节：文档和知识沉淀。

AI项目做了一段时间，团队里有人离职了，新来的人不知道这个系统是怎么搭的、数据是怎么管的、模型是怎么调的。这就很被动。

所以，从一开始就要养成习惯：每一步操作，都要写文档。数据怎么清洗的，标注规范是什么，模型选了哪个版本，训练参数怎么设的，都要记下来。

不是为了给别人看，是为了给未来的自己看。