从生产稳定角度,AI企业应用的一些基础工作
很多企业兴致勃勃地上了AI项目,花了几个月时间,投入了不少钱。上线时,老板很高兴,觉得终于赶上了时代的列车。可过了两三个星期,就不怎么用了。为什么?日常生活工作AI可以给些帮助,但到了正事上,有时AI给出的建议不准,有时数据更新不及时,更有进用起来比原来还麻烦。最后,系统就安安静静地躺在服务器里了,没人提起,也没人敢问。其实不是AI不行,是在做AI落地之前,有一些基础工作没做扎实。AI在企业里要稳定运行,能持续创造价值,得先把这几件事想清楚。
一、需求确认:别把“想要”当成“需要”
很多企业的AI项目,起步就歪了。怎么歪的?老板看了几个短视频,或听了次课,觉得AI很厉害,然后跟技术说:“我们也要搞一个。”技术问:“搞什么?”老板讲不明白,但表达的意思挺清楚:“你自己看,反正要AI。”有点像去看病,跟医生说“给我开点药”,但不说哪儿不舒服。医生不惯着你,但技术或乙方,就只好猜测着来满足你。
AI落地也一样,第一步不是选模型、不是搭系统,是坐下来,安安静静地问自己一个问题:到底要解决什么具体的、可描述的痛点?
比如有家企业想用AI做智能客服。理由是“客户咨询太多了,客服忙不过来”。听起来很合理。但真的坐下来一分析,发现客户咨询里有一半是物流查询,问“我的货到哪了”。这个问题,其实把订单系统跟物流系统打通,做一个自动查询入口就能解决,根本用不到AI。剩下的一半,才是真正的产品问题、售后问题。这时就不需要做大而全的智能客服,只需要把物流查询做成自助。
需求确认的意义就是这样。并不是所有问题都需要AI,也不是AI能解决所有问题。你得先分清楚,哪些是规则问题,哪些是经验问题,哪些是真正需要智能判断的问题。
规则问题,比如“满多少减多少”“什么时候发货”,写清楚逻辑,让系统自动执行就行,没必要让AI来学。经验问题,比如“这个客户语气很急,可能需要优先处理”,这种靠人凭感觉判断的,才是AI能学的地方。
还有一点容易踩坑:需求要说得具体。不能说“提高客服效率”,太模糊。要说“把客户工单从分类到分配的时间,从平均十分钟压缩到两分钟”。有这个具体数字,后面你才知道成没成功。
需求确认做完,还有一个动作不能省:排优先级。企业里痛点很多,时间、预算、人力都有限。别想着一次解决所有问题,挑一个最疼的、回报最明确的,先做。做成一个,大家有了信心,再做第二个。
二、数据是AI的粮食
如果说AI是一辆车,数据就是油。油不好,车跑不起来。油不够,车跑不远。
很多企业的数据情况,让人头疼。数据散落在各个系统里,CRM一套、ERP一套、Excel又一堆。同一个客户,在这叫“张三科技有限公司”,在那叫“张三科技”,还有的叫“张总”。这些脏数据喂给AI,它学不会准确地判断。
所以,数据工作的第一步,是采集,采集或收集相关的数据。
第二步是清洗。把重复的去掉,把格式统一,把明显的错误修正。这个过程很枯燥,也没什么技术含量,但绕不过去。就像一个厨师,炒菜之前得洗菜、切菜,不能不洗直接用。
清洗完之后,是标注。这是更费功夫的活。比如说,你要训练一个AI来识别客户的投诉类型。你得先把历史的一千份工单拿出来,人工给每一条打标签:这个是“产品质量”,那个是“物流延迟”,还有一个是“客服态度”。AI就是从这些打好的标签里学习规律。标注的质量,直接决定了AI学出来的水平。
有人说,这些活能不能让AI自己干?可以,但那是在你已经有一个基础模型之后。最开始的那批训练数据,必须人工标注,没有捷径。
还有一点容易被忽略:数据的管理和更新。很多企业的数据是静态的。去年整理了一批,今年还拿那批来用。可是业务在变,客户在变,产品在变。去年标注的“产品质量”投诉,可能今年产品升级了,那个问题已经不存在了。如果你不更新数据,AI就会一直停留在过去的认知里。
定期审视数据,定期补充新的数据,定期淘汰过时的数据。这件事,要有人专门负责。可以是一个人,也可以是一个小团队,但不能没人管。
除了内部数据,有时候还需要外部数据。比如做竞品分析,就不能只看自己家的数据,还得去爬公开的信息。这些外部数据的获取、清洗、更新,又是一套活。但原则是一样的:干净、够吃、能持续。

三、模型的选择和训练:别追新,要追稳
模型这个词,听起来很技术,其实可以理解成“AI的大脑”。市面上有各种各样的模型,开源的、闭源的,大的、小的,通用的、垂直的。怎么选?
原则很简单:够用就行,不追新、不追大。
很多企业容易犯一个错误,觉得自己要做AI,就得用最厉害的模型。GPT-4出来了,赶紧用;Claude3出来了,又换。花了很多精力在切换模型上,却没花精力在数据上。
其实,模型的选择,应该反过来:先看你的数据量有多少,再看你的场景需要什么能力,最后才选模型。数据量小,就别用大模型,小模型就够了,跑得还快。场景简单,比如只是做个文本分类,就没必要用那种能写诗能编程的通用大模型,杀鸡用不着牛刀。
选好了模型,接下来是训练。训练不是一次性的事,是持续的过程。第一次训练,让AI学会基础能力。上线之后,根据实际运行情况,不断用新的数据去微调、去优化。就像一个人,上学是基础教育,工作是持续学习。AI也一样。
还有一点很重要:监控。AI上线之后,得有人盯着它跑得怎么样。给出的建议准不准?用户满不满意?有没有出现明显的错误?这些问题,不能等用户投诉了才知道,要主动监控、主动发现、主动修正。
监控的方式可以很简单。比如,每周随机抽一百条AI的处理结果,人工复核一遍,看看准确率是多少。如果准确率下降了,就要去找原因:是数据出了问题,还是场景变了,还是模型需要重新训练。
最后,说一个容易被忽视的细节:文档和知识沉淀。
AI项目做了一段时间,团队里有人离职了,新来的人不知道这个系统是怎么搭的、数据是怎么管的、模型是怎么调的。这就很被动。
所以,从一开始就要养成习惯:每一步操作,都要写文档。数据怎么清洗的,标注规范是什么,模型选了哪个版本,训练参数怎么设的,都要记下来。
不是为了给别人看,是为了给未来的自己看。
夜雨聆风