乐于分享
好东西不私藏

从生产稳定角度,AI企业应用的一些基础工作

从生产稳定角度,AI企业应用的一些基础工作

很多企业兴致勃勃地上了AI项目,花了几个月时间,投入了不少钱。上线,老板很高兴,觉得终于赶上了时代的列车。可过了两三个星期,就不怎么用了。为什么?日常生活工作AI可以给些帮助,但到了正事上,有时AI给出的建议不准,有时数据更新不及时,更有进用起来比原来还麻烦。最后,系统就安安静静地躺在服务器里,没人提起,也没人敢问。其实不是AI不行,是在做AI落地之前,有一些基础工作没做扎实。AI在企业里要稳定运行,能持续创造价值,得先把这几件事想清楚。

一、需求确认:别把想要当成需要

很多企业的AI项目,起步就歪了。怎么歪的?老板看了几个短视频,或听了次课,觉得AI很厉害,然后跟技术说:我们也要搞一个。技术问:搞什么?老板讲不明白,但表达的意思挺清楚:你自己看,反正要AI。有点像去看病,跟医生说给我开点药,但不说哪儿不舒服。医生不惯着你,但技术或乙方,就只好猜测着来满足你。

AI落地也一样,第一步不是选模型、不是搭系统,是坐下来,安安静静地问自己一个问题:到底要解决什么具体的、可描述的痛点?

比如有家企业想用AI做智能客服。理由是客户咨询太多了,客服忙不过来。听起来很合理。但真的坐下来一分析,发现客户咨询里有一半是物流查询,问我的货到哪了。这个问题,其实把订单系统跟物流系统打通,做一个自动查询入口就能解决,根本用不到AI。剩下的一半,才是真正的产品问题、售后问题。这时就不需要做大而全的智能客服,只需要把物流查询做成自助。

需求确认的意义就是这样不是所有问题都需要AI,也不是AI能解决所有问题。你得先分清楚,哪些是规则问题,哪些是经验问题,哪些是真正需要智能判断的问题。

规则问题,比如满多少减多少”“什么时候发货,写清楚逻辑,让系统自动执行就行,没必要让AI来学。经验问题,比如这个客户语气很急,可能需要优先处理,这种靠人凭感觉判断的,才是AI能学的地方。

还有一点容易踩坑:需求要说得具体。不能说提高客服效率,太模糊。要说把客户工单从分类到分配的时间,从平均十分钟压缩到两分钟。有这个具体数字,后面你才知道成没成功。

需求确认做完,还有一个动作不能省:排优先级。企业里痛点很多,时间、预算、人力都有限。别想着一次解决所有问题,挑一个最疼的、回报最明确的,先做。做成一个,大家有了信心,再做第二个。

二、数据AI的粮食

如果说AI是一辆车,数据就是油。油不好,车跑不起来。油不够,车跑不远。

很多企业的数据情况,让人头疼。数据散落在各个系统里,CRM一套、ERP一套、Excel又一堆。同一个客户,在这叫张三科技有限公司,在那叫张三科技,还有的叫张总。这些脏数据喂给AI,它学不会准确地判断。

所以,数据工作的第一步,是采集,采集或收集相关的数据。

第二步是清洗。把重复的去掉,把格式统一,把明显的错误修正。这个过程很枯燥,也没什么技术含量,但绕不过去。就像一个厨师,炒菜之前得洗菜、切菜,不能不洗直接用

清洗完之后,是标注。这是更费功夫的活。比如说,你要训练一个AI来识别客户的投诉类型。你得先把历史的一千份工单拿出来,人工给每一条打标签:这个是产品质量,那个是物流延迟,还有一个是客服态度AI就是从这些打好的标签里学习规律。标注的质量,直接决定了AI学出来的水平。

有人说,这些活能不能让AI自己干?可以,但那是在你已经有一个基础模型之后。最开始的那批训练数据,必须人工标注,没有捷径。

还有一点容易被忽略:数据的管理和更新。很多企业的数据是静态的。去年整理了一批,今年还拿那批来用。可是业务在变,客户在变,产品在变。去年标注的产品质量投诉,可能今年产品升级了,那个问题已经不存在了。如果你不更新数据,AI就会一直停留在过去的认知里。

定期审视数据,定期补充新的数据,定期淘汰过时的数据。这件事,要有人专门负责。可以是一个人,也可以是一个小团队,但不能没人管。

除了内部数据,有时候还需要外部数据。比如做竞品分析,就不能只看自己家的数据,还得去爬公开的信息。这些外部数据的获取、清洗、更新,又是一套活。但原则是一样的:干净、够吃、能持续。

三、模型的选择和训练:别追新,要追稳

模型这个词,听起来很技术,其实可以理解成AI的大脑。市面上有各种各样的模型,开源的、闭源的,大的、小的,通用的、垂直的。怎么选?

原则很简单:够用就行,不追新、不追大。

很多企业容易犯一个错误,觉得自己要做AI,就得用最厉害的模型。GPT-4出来了,赶紧用;Claude3出来了,又换。花了很多精力在切换模型上,却没花精力在数据上。

其实,模型的选择,应该反过来:先看你的数据量有多少,再看你的场景需要什么能力,最后才选模型。数据量小,就别用大模型,小模型就够了,跑得还快。场景简单,比如只是做个文本分类,就没必要用那种能写诗能编程的通用大模型,杀鸡用不着牛刀。

选好了模型,接下来是训练。训练不是一次性的事,是持续的过程。第一次训练,让AI学会基础能力。上线之后,根据实际运行情况,不断用新的数据去微调、去优化。就像一个人,上学是基础教育,工作是持续学习。AI也一样。

还有一点很重要:监控。AI上线之后,得有人盯着它跑得怎么样。给出的建议准不准?用户满不满意?有没有出现明显的错误?这些问题,不能等用户投诉了才知道,要主动监控、主动发现、主动修正。

监控的方式可以很简单。比如,每周随机抽一百条AI的处理结果,人工复核一遍,看看准确率是多少。如果准确率下降了,就要去找原因:是数据出了问题,还是场景变了,还是模型需要重新训练。

最后,说一个容易被忽视的细节:文档和知识沉淀。

AI项目做了一段时间,团队里有人离职了,新来的人不知道这个系统是怎么搭的、数据是怎么管的、模型是怎么调的。这就很被动。

所以,从一开始就要养成习惯:每一步操作,都要写文档。数据怎么清洗的,标注规范是什么,模型选了哪个版本,训练参数怎么设的,都要记下来。

不是为了给别人看,是为了给未来的自己看。