2025年以来,银行业掀起新一轮AI大模型落地潮。从国有大行到股份制银行,从城商行到农商行,几乎每一家都在竞相将千亿级参数大模型推进手机银行App,智能客服、智能投顾、智能风控、智能运营等功能以前所未有的速度走向客户终端。从公开数据来看,工商银行"工银智涌"大模型体系已在30余个业务领域落地500余个AI应用场景,AI数字员工年承担工作量达5.5万人年;招商银行大模型应用已覆盖856个业务场景,累计替代人工时长超1556万小时;建设银行大模型赋能398个场景应用,网点AI助手覆盖率达到99.42%;中信银行全行智能模型增效超1.7万人年。这些数字单独拿出来都很亮眼,但凡景体验咨询在长期跟踪银行App用户体验的过程中,发现了一个值得警惕的现象:技术能力在快速填坑,但体验鸿沟却在越填越宽。
大模型带来的"智能化"标签与用户实际使用感知之间存在明显错位,这种错位不是技术不够先进,而是体验设计逻辑与用户真实需求之间出现了结构性脱节。为什么会出现这种情况?核心原因是银行在大模型应用中,更多关注的是"我们能做到什么",而非"用户真正需要什么"。比如,智能客服确实能回答更多问题了,但用户更关心的是"我的问题能不能一次性解决";智能投顾确实能推荐更精准的产品了,但用户更在意的是"推荐的产品是不是适合我";智能风控确实能识别更复杂的风险了,但用户体验到的可能只是"怎么突然又让我验证身份了"。大模型的技术能力确实在提升,但如果这些能力不能转化为用户能感知到的体验改善,那技术进步的意义就会被大打折扣。
一. 手机银行App里的大模型到底给用户带来了什么
2025年是银行业AI大模型从试点走向标配的转折年。根据各银行2025年年报及业绩发布会公开披露信息,国有六大行及主要股份制银行均已实现大模型在手机银行App中的规模化落地,应用场景从最初的智能客服迅速扩展至投研、风控、运营、合规等核心业务链条。这不是简单的技术升级,而是银行服务模式的系统性重构。过去用户有什么问题要打电话给客服,现在直接在App里问AI;过去用户要自己研究理财产品,现在AI能给个性化推荐;过去用户要填很多表格申请贷款,现在AI能帮忙预填信息。变化确实在发生,但变化的幅度和用户感知的幅度之间,存在显著落差。
我们以招商银行为例,该行在2025年年报中提出"AI First"战略,累计落地领域专精模型183个,在零售金融、批发金融、风控、运营、办公等领域落地AI场景应用856个,日均Token吞吐量达260亿,较2024年增长10.1倍。在对公端,小企业尽调报告82%的工作量已由大模型替代人工,在线风控平台2025年审批对公信贷规模接近6000亿元,同比增长44%,贷后风险预警时间较传统人工模式提前42天。从全行口径看,大模型应用累计替代人工时长超1556万小时,相当于节省超8000名全职员工工作量。这是非常可观的效率提升,但从用户视角看,这些效率提升发生在银行的内部流程中,用户能直接体验到的只是"尽调更快了""审批更快了",而不是"AI大模型让我的贷款申请变得更简单了"。用户不会因为"银行节省了8000名员工工作量"而感到高兴,用户只会关心"我的贷款什么时候能批下来"。
北京银行在2025年年报中明确将"人工智能驱动的商业银行"作为转型方向,提出"All in AI"战略。该行已构建"1+3+1"AI技术体系(一体化算力底座、三大模型平台、统一智能体平台),建成280个智能体,远程银行智能化服务占比保持在83%以上。在研发端,需求预审效率提升80%以上;在风控端,"冒烟指数"4.0版本结合"新风系统"实现风险精准画像与前瞻预警。这些数据展示了AI对银行运营的全面渗透,但对于申请贷款的中小企业来说,他们能感知到的是"审批变快了",而不是"AI让审批变快了"。银行内部的技术进步,如果不能转化为用户能感知的体验改善,那就很难产生真正的用户价值。
银行业大模型应用已经从"有没有"进入了"强不强"的阶段。但凡景体验咨询在梳理多家银行App实际使用情况后发现,技术指标的光鲜与用户感知的"智能"之间,仍存在不容忽视的体验断层。大模型在银行App中的落地,确实带来了很多功能层面的变化,比如智能客服能回答的问题更多了,智能投顾能推荐的产品更精准了,智能风控能识别的风险更复杂了。但用户真的感知到这些变化了吗?还是说,这些变化更多停留在银行内部的效率提升上,而用户看到的只是"换了个更会说话的客服机器人"?这是一个需要认真思考的问题。
二. 用户真正感受到了什么
大模型加持下的银行App智能客服,目前普遍被宣传为"理解复杂意图""多轮对话能力显著提升"。银行在宣传AI功能时,往往强调"能理解自然语言""能处理复杂问题""能进行多轮对话",这些说法在技术上确实是进步,但在用户体验上,用户感受不到"复杂意图被理解",用户只能感受到"我问了问题,你答非所问"。实际使用中,各银行App的用户反馈显示,当用户问题描述稍超出标准模板——比如一个用户问:"我想把这张卡的钱转去还房贷,怎么操作最划算"——AI的回复往往回归至"请拨打客服热线"或堆砌条款式说明,并未真正理解用户的复合意图。
用户问的是"怎么操作最划算",这里面包含了多个意图:第一,我想转账还房贷;第二,我想知道哪种方式最划算(可能是问手续费、汇率、或者还款方式);第三,我可能需要比较不同方案。但AI往往只能识别到第一个意图,然后给出"您可以进入转账页面……"的通用回答,完全没有涉及"最划算"这个核心诉求。这不是AI的问题,而是体验设计的问题——AI被设计成"回答问题",而不是"解决问题"。当用户问"怎么操作最划算"时,用户需要的不是"操作指南",而是"方案对比"和"最优推荐"。
更深层的问题是,AI对"最划算"的理解可能与用户不同。AI可能从手续费角度判断"最划算",但用户可能还考虑时间成本、操作便捷性、汇率波动等因素。如果AI只是给出一个"最优方案",而没有解释为什么这个方案是最优的,用户可能会觉得"你们只是想让我用你们的产品"。真正优秀的智能客服,应该能理解用户的真实意图,给出方案的同时解释依据,并允许用户进一步追问。
另一个高频被吐槽的问题是"智能推荐"变成"精准骚扰"。大模型赋能的个性化推荐在银行App中广泛用于控制产品营销,但用户体验研究表明,当推荐算法无法准确判断用户真实意图时,"智能推荐"极易演变为"精准骚扰"。例如某银行App根据用户浏览过某理财产品,随后连续7天在首页推送同类产品,导致用户产生"被监控"的反感情绪。问题不在于算法不够先进,而在于体验设计未给用户留有"拒绝被智能"的控制感。
这不是技术问题,而是体验设计问题——AI不知道用户的真实意图,只是根据行为模式做出判断,而这种判断在某些场景下会让用户感到"被冒犯"。好的推荐应该是"推而不扰",即用户能看到推荐但不被打扰;而不是"推而必扰",用户每次打开App都被同样的推送刷屏。银行需要设计更精细的推荐策略,比如:用户只是浏览了产品页面,不应该触发连续推送;用户浏览后停留时间较长或查看详情,才可以考虑推送;推送频率要有上限,不能超过每天一次或每周三次。
还有一个深层的体验断点出现在复杂业务场景中。银行App中涉及多步骤、跨模块的业务(如对公账户开立、跨境汇款、信贷申请),大模型目前主要解决的是单一环节的智能化(如智能填写、智能审核),但跨环节的连贯体验仍然依赖用户自己"连"。用户体验测试表明,在大模型加持下,单个环节的效率确实提升了,但整体任务完成路径并未显著缩短——局部智能并未带来全局体验的系统性提升。
三. 为什么体验鸿沟会存在
要理解为什么技术越先进、体验鸿沟反而越宽,需要从银行组织内部的设计逻辑入手。凡景体验咨询通过调研和对比研究,梳理出五个结构性成因。这五个成因不是孤立的,而是相互关联的——它们共同构成了一个"体验鸿沟不断拉大"的系统性困局。
——第一个成因是技术指标与体验指标未对齐。当前银行大模型应用的评价体系,仍以"调用量""准确率""替代人工时长"等技术-效率类指标为核心。这些指标衡量的是"技术有没有用",而非"用户觉得好不好用"。技术团队的KPI是"提升AI分流率",但用户的KPI是"问题能不能解决"。当考核指标指向"调用量"时,技术团队会倾向于让AI"多回答问题",而不是"多解决问题"。比如,AI可能会倾向于给用户提供"更多信息",而不是"更精准的解决方案"——因为"信息量"可以被统计为"调用量",但"问题是否解决"很难被量化。
凡景体验咨询在《以客户为中心打造差异化体验驱动银行财富管理服务模式创新》一文中曾指出,财富管理的核心竞争力是客户满意度(中国人民银行《金融从业规范财富管理》明确界定)。这一逻辑同样适用于AI大模型的体验评价——大模型应用的终极评价标尺,不是算力、参数、调用量,而是客户满意度。当银行的考核指挥棒指向"调用量"而非"满意度"时,体验鸿沟的扩大几乎是必然的。技术团队追求的是"AI分流率",而用户关心的是"问题是否得到解决"。两个目标不一致,体验就很难真正改善。
——第二个成因是"智能化"设计的出发点仍然是"银行中心"而非"用户中心"。大模型在银行App中的功能设计,目前仍以"替代人工""降本增效"为主要目标。这导致智能功能的入口设计、交互逻辑、反馈机制都围绕"银行效率最大化"展开,而非"用户体验最优化"。一个典型的例子是:多家银行App将AI客服置于"第一时间接管"位置,用户无法快速转人工(需多次点击"转人工"才会触发)。从银行视角看,这提升了AI分流率;从用户视角看,这增加了"被AI困住"的挫败感。两个视角得出的体验评价完全不同。银行觉得自己是在"用AI提升服务效率",用户觉得银行是在"用AI省钱,根本不在乎我的问题有没有解决"。
——第三个成因是缺乏"用户可控"的智能边界设计。优秀的智能体验,应该让用户始终感受到"可控感"——知道AI在做什么、可以纠正AI的错误、可以在AI与人工之间自由切换。目前银行App中大模型功能的交互设计,普遍存在"黑盒化"问题:AI给出了建议,但用户不知道建议的依据是什么;AI犯了错误,用户不清楚如何反馈纠正;AI处理失败后,用户需要重新开始,而非"接着AI没做完的地方继续"。这种失控感会使用户对"智能"产生抵触心理,甚至刻意避开AI功能。用户会觉得:既然AI帮不上忙,还浪费时间,那不如一开始就直接找人工。
——第四个成因是组织协同的"智能孤岛"。银行内部大模型应用通常由科技部或数字金融部牵头,而用户体验优化由网金部或客户体验部门负责。两个条线目标不同、考核不同、协同成本较高,导致"技术落地"与"体验优化"往往是"各干各的"。技术部门关注的是"大模型能否跑通这个场景",体验部门关注的是"用户在这个场景下是否顺畅"。如果缺乏跨部门的用户体验协同机制,技术越先进,体验鸿沟反而可能越大。因为技术部门在不断做"加法"(增加智能功能),但如果没有体验部门的"减法"(优化冗余流程),用户面对的复杂度反而上升了。结果是银行觉得自己"AI能力越来越强",用户觉得"App越来越难用"。
四. 缩小体验鸿沟的几点建议
凡景体验咨询基于对各银行App用户体验的持续跟踪研究,结合2025-2026年大模型应用的最新实践,提出以下建议,仅供银行体验部门和设计从业者参考。这些建议不是"锦上添花",而是"必须要做"的基础性工作——如果这些问题不解决,大模型应用得再多,用户体验也很难真正改善。
第一个建议是建立"以客户满意度为核心"的大模型体验评价体系。建议银行在现有技术指标(调用量、准确率、替代工时)基础上,增加用户体验类指标:任务完成率(用户在大模型辅助下,是否真正完成了目标操作)、NPS净推荐值(用户使用该智能功能后,是否愿意推荐给他人)、人工转接率(有多少用户在AI交互后仍然选择转人工,这个比例反映AI实际解决能力)、用户可控感评分(用户是否能理解AI的决策依据,是否能方便地纠正AI错误)。
部分头部银行已在年报中提及对用户体验的重视,但这方面的制度建设仍有较大提升空间。评价体系变了,优化方向才会变。如果考核指标只是"调用量",那AI的优化方向就是"让用户多问问题";如果考核指标是"解决率",那AI的优化方向才会变成"真正解决问题"。
第二个建议是在体验设计层面给用户"智能控制权"。具体可采取以下设计策略:一是可视化的AI决策依据,当AI给出理财建议或风控判断时,以简洁语言说明依据(如"根据您近6个月的资产结构和风险测评结果,建议……"),而非只给结论;二是无缝的人机切换机制,用户随时可以"打断AI"并转人工,且人工坐席能看到AI已经处理到哪一步,避免用户重复描述问题。
招商银行在部分对公场景中已实现AI与人工坐席的上下文继承,这一实践值得在零售端推广;三是用户可定义的"智能边界",允许用户设置AI介入的程度(例如"仅在我询问时回答"vs"可以主动推荐"),而非强制所有用户接受统一化的"智能服务"。让用户有选择权,比给用户更多功能更重要。用户不喜欢"被智能",用户喜欢的是"我用你的时候你帮我,我不想用你的时候你别烦我"。
第三个建议是以"客户旅程"为主线整合智能功能,而非以"技术能力"为主线。目前银行App的AI功能设计,多以"我们能做什么"为出发点(例如:我们有智能客服、智能投顾、智能风控,分别做成三个入口)。但用户并不关心"银行有什么技术",用户只关心"我要完成什么任务"。
凡景体验咨询建议,银行应基于客户旅程地图(Customer Journey Map)重新梳理AI功能的呈现方式:以用户任务为主线(如"买房→贷款→还款"全流程),在旅程的关键触点嵌入智能化能力,而非让用户自己去"找"AI功能。建设银行在2025年年报中提到的"授信审批全流程AI应用",正是向"旅程智能"方向迈进的有益尝试。用户不需要知道"你们有智能投顾",用户只需要在考虑提前还款时,App主动告诉他"提前还10万能省多少利息"。
五. 最后几句话
AI大模型"装进"手机银行App,是银行业数智化转型的重要里程碑。但技术的归技术,体验的归体验——大模型可以让银行变得更"聪明",但只有以客户为中心的体验设计,才能让用户感受到"聪明"的价值。
凡景体验咨询认为,2026年是银行业大模型应用从"技术验证"走向"体验验证"的关键窗口期。那些能够率先建立"技术+体验"双轮驱动机制的银行,将在下一阶段的客户体验竞争中占据主动。智能体验的鸿沟,不是技术填不平,而是体验设计还没跟上来。(完)
相关文章推荐阅读:
夜雨聆风