为什么有些AI项目能交付,有些只能"应付"?
上个月公司邀请了一位AI项目的负责人来做内部分享。他来自一家万人公司,是AI团队的总负责人,主要给央国企、政府做AI项目。项目偏向大型,有明显的政府和央国企属性。不过里面一些内容还是挺实在的,今天整理出来分享。
企业AI最大的幻觉
以为买了平台就能落地。
很多企业以为AI落地的流程是这样的:买个DeepSeek一体机,把文档往里一灌,AI就能用了。还有些企业买了Coze,以为有了Coze这个工作流编排工具,AI应用就能跑起来了。
但现实是什么?平台买了,效果出不来。
问题出在哪?不是大模型不行。平台只是个工具,买回来你还得有配套的东西——数据治理能力、应用搭建能力、持续运维能力。工具只是起点,离真正落地还差得远。
以为AI可以马上替代人。
这个坑特别常见。很多企业一把手上来就问:”我能不能用AI把某个部门砍掉?”
他举了个例子。有一家公司,听了很多AI狂热者的分享,一激动把客服部门砍了大半。结果AI客服效果达不到预期,客户投诉暴涨,公司估值大跌。没办法,又得把人一个个招回来。
❌ 错误思路:AI替代人 → 裁员 → 业务崩盘✅ 正确思路:AI辅助人 → 提升效率 → 逐步调整
那正确的做法是什么?他分享了自己公司的思路。不是一上来就裁员,而是先让现有的人用起来。
他们公司之前有前后端分工——前端写前端,后端写后端。引入AI工具后,前后端的边界模糊了,一个人可以做的事情更多了。以前前后端分工明确,现在在一些简单项目上,可能不需要严格区分前后端,只需要一个后端或一个前端就能完成。这促使工程师逐渐向全栈方向发展。
这个过程不是直接裁人,而是先优化工作方式,让组织慢慢适应。看到效果了,再考虑怎么调整岗位。想一步到位,往往死得很惨。
用传统软件思维做AI项目。
传统软件团队有两个常见问题。
第一个,做完了不等于做好了。传统软件团队的逻辑是:功能开发完了,验收通过,就意味着这件事做好了。但AI不是这样的。你开发了一个AI功能,上线了,不代表它真的能解决问题。很多企业不懂这个,他们认为”功能上线了,这件事就完了”。结果就是AI用不起来。有些公司给客户做了,做不好,就说是AI能力不行,是AI的问题。其实是因为他们只会调提示词,其他方法不会。
第二个,没有建立评测体系。传统软件团队提需求是功能驱动的——我要什么功能,你给我开发出来。功能做了,但没有人说得清楚什么叫”好”、什么叫”能用”。最后客户用起来觉得不对,但又没有依据来判定是哪里有问题。扯皮就从这儿开始了。
大模型部署的坑
数据准备不充分。
很多人以为AI落地的关键是选一个好的大模型。还有人觉得,数据嘛,上传进去就行了。
都不是。企业的历史数据是给人看的,不是给AI训练的。噪声大、格式乱、缺少标注,扔给AI它也消化不了。数据质量不过关,选什么模型都没用。数据工程才是AI落地的主工作,不是附属工作。
私有化部署的适配问题。
如果你做的项目涉及保密数据,不能用线上大模型,必须私有化部署。但私有化部署有几个地方可能会出问题,采购前得先了解清楚。
第一,芯片兼容性可能会有问题。英伟达的卡用的是CUDA框架,国产芯片可能不支持CUDA。模型厂商没适配过,你买回来跑不起来,或者跑起来效果差一截。
第二,量化可能会降效果。为了让模型在有限算力上跑得快,往往要做量化处理。量化后的模型,推理能力可能会打对折。
第三,上下文窗口可能会被压缩。线上大模型可以支持128K的上下文,但很多私有化部署的机器为了节省资源,只给你开4K或8K。超过这个长度的内容,模型可能会”失忆”。
AI项目落地的几个建议
先咨询,再动手。
很多企业找过来的时候状态是:有预算,不知道从哪下手。这种客户最好的做法是先做一次轻咨询。
怎么咨询?先给管理层做一次AI认知培训,让他搞清楚AI能干什么、不能干什么。然后再带着他一起梳理场景优先级,评估数据现状。这步做了,客户才能判断这件事能不能做、能做到什么程度。
大企业先想AI+,别想AI Native。
AI Native是什么意思?从零开始构建全新的业务流程。
现实吗?对于大国企来说,不现实。他们的IT系统盘根错节,几百套系统在那儿跑。你跟他说推倒重来,他能把预算直接砍掉。
正确路径是什么?在现有流程上叠加AI能力。他用他的OA,你给他的OA加一个AI助手。比让他换一套系统容易一百倍。
场景优先级。
不是所有业务都适合用AI。他的判断标准是三个类型:
├─ 知识密集型:客服问答、文档处理、法规查询│ → 最容易见效,AI直接接管├─ 人力密集型:工单分发、数据汇总、内容审核│ → 能省力气,但需人工复核└─ 数据密集型:报表分析、趋势预测 → 依赖高质量数据,没数据别碰
你手头有个场景想用AI改造,先对照这个标准想想在哪个象限。
技术选型要灵活。
微调听起来高大上,但成本高、周期长。他的建议是:先用提示工程 + RAG + 工作流优化来解决问题。效果不够,再考虑微调。
大模型和小模型要配合使用:大模型做理解、推理、归纳;结构化的稳定判断交给小模型或者传统算法。没必要让大模型干它不擅长的事。
最后
我们在交流如何做AI项目的时候发现,市面上做AI项目的公司差距挺大的。
有些还在用传统功能思维做AI产品,觉得功能有、能用就可以交付了。有些甚至停留在”调个大模型就能用”的阶段,连数据工程、评测体系这些基础认知都没有。这种差距做出来的项目效果肯定不一样。说到底,还是认知的差距。
夜雨聆风