AI大模型装进手机银行App之后——智能体验的鸿沟为何越填越宽

2025年以来，银行业掀起新一轮AI大模型落地潮。从国有大行到股份制银行，从城商行到农商行，几乎每一家都在竞相将千亿级参数大模型推进手机银行App，智能客服、智能投顾、智能风控、智能运营等功能以前所未有的速度走向客户终端。从公开数据来看，工商银行"工银智涌"大模型体系已在30余个业务领域落地500余个AI应用场景，AI数字员工年承担工作量达5.5万人年；招商银行大模型应用已覆盖856个业务场景，累计替代人工时长超1556万小时；建设银行大模型赋能398个场景应用，网点AI助手覆盖率达到99.42%；中信银行全行智能模型增效超1.7万人年。这些数字单独拿出来都很亮眼，但凡景体验咨询在长期跟踪银行App用户体验的过程中，发现了一个值得警惕的现象：技术能力在快速填坑，但体验鸿沟却在越填越宽。

大模型带来的"智能化"标签与用户实际使用感知之间存在明显错位，这种错位不是技术不够先进，而是体验设计逻辑与用户真实需求之间出现了结构性脱节。为什么会出现这种情况？核心原因是银行在大模型应用中，更多关注的是"我们能做到什么"，而非"用户真正需要什么"。比如，智能客服确实能回答更多问题了，但用户更关心的是"我的问题能不能一次性解决"；智能投顾确实能推荐更精准的产品了，但用户更在意的是"推荐的产品是不是适合我"；智能风控确实能识别更复杂的风险了，但用户体验到的可能只是"怎么突然又让我验证身份了"。大模型的技术能力确实在提升，但如果这些能力不能转化为用户能感知到的体验改善，那技术进步的意义就会被大打折扣。

一. 手机银行App里的大模型到底给用户带来了什么

2025年是银行业AI大模型从试点走向标配的转折年。根据各银行2025年年报及业绩发布会公开披露信息，国有六大行及主要股份制银行均已实现大模型在手机银行App中的规模化落地，应用场景从最初的智能客服迅速扩展至投研、风控、运营、合规等核心业务链条。这不是简单的技术升级，而是银行服务模式的系统性重构。过去用户有什么问题要打电话给客服，现在直接在App里问AI；过去用户要自己研究理财产品，现在AI能给个性化推荐；过去用户要填很多表格申请贷款，现在AI能帮忙预填信息。变化确实在发生，但变化的幅度和用户感知的幅度之间，存在显著落差。

我们以招商银行为例，该行在2025年年报中提出"AI First"战略，累计落地领域专精模型183个，在零售金融、批发金融、风控、运营、办公等领域落地AI场景应用856个，日均Token吞吐量达260亿，较2024年增长10.1倍。在对公端，小企业尽调报告82%的工作量已由大模型替代人工，在线风控平台2025年审批对公信贷规模接近6000亿元，同比增长44%，贷后风险预警时间较传统人工模式提前42天。从全行口径看，大模型应用累计替代人工时长超1556万小时，相当于节省超8000名全职员工工作量。这是非常可观的效率提升，但从用户视角看，这些效率提升发生在银行的内部流程中，用户能直接体验到的只是"尽调更快了""审批更快了"，而不是"AI大模型让我的贷款申请变得更简单了"。用户不会因为"银行节省了8000名员工工作量"而感到高兴，用户只会关心"我的贷款什么时候能批下来"。

北京银行在2025年年报中明确将"人工智能驱动的商业银行"作为转型方向，提出"All in AI"战略。该行已构建"1+3+1"AI技术体系（一体化算力底座、三大模型平台、统一智能体平台），建成280个智能体，远程银行智能化服务占比保持在83%以上。在研发端，需求预审效率提升80%以上；在风控端，"冒烟指数"4.0版本结合"新风系统"实现风险精准画像与前瞻预警。这些数据展示了AI对银行运营的全面渗透，但对于申请贷款的中小企业来说，他们能感知到的是"审批变快了"，而不是"AI让审批变快了"。银行内部的技术进步，如果不能转化为用户能感知的体验改善，那就很难产生真正的用户价值。

银行业大模型应用已经从"有没有"进入了"强不强"的阶段。但凡景体验咨询在梳理多家银行App实际使用情况后发现，技术指标的光鲜与用户感知的"智能"之间，仍存在不容忽视的体验断层。大模型在银行App中的落地，确实带来了很多功能层面的变化，比如智能客服能回答的问题更多了，智能投顾能推荐的产品更精准了，智能风控能识别的风险更复杂了。但用户真的感知到这些变化了吗？还是说，这些变化更多停留在银行内部的效率提升上，而用户看到的只是"换了个更会说话的客服机器人"？这是一个需要认真思考的问题。

二. 用户真正感受到了什么

大模型加持下的银行App智能客服，目前普遍被宣传为"理解复杂意图""多轮对话能力显著提升"。银行在宣传AI功能时，往往强调"能理解自然语言""能处理复杂问题""能进行多轮对话"，这些说法在技术上确实是进步，但在用户体验上，用户感受不到"复杂意图被理解"，用户只能感受到"我问了问题，你答非所问"。实际使用中，各银行App的用户反馈显示，当用户问题描述稍超出标准模板——比如一个用户问："我想把这张卡的钱转去还房贷，怎么操作最划算"——AI的回复往往回归至"请拨打客服热线"或堆砌条款式说明，并未真正理解用户的复合意图。

用户问的是"怎么操作最划算"，这里面包含了多个意图：第一，我想转账还房贷；第二，我想知道哪种方式最划算（可能是问手续费、汇率、或者还款方式）；第三，我可能需要比较不同方案。但AI往往只能识别到第一个意图，然后给出"您可以进入转账页面……"的通用回答，完全没有涉及"最划算"这个核心诉求。这不是AI的问题，而是体验设计的问题——AI被设计成"回答问题"，而不是"解决问题"。当用户问"怎么操作最划算"时，用户需要的不是"操作指南"，而是"方案对比"和"最优推荐"。

更深层的问题是，AI对"最划算"的理解可能与用户不同。AI可能从手续费角度判断"最划算"，但用户可能还考虑时间成本、操作便捷性、汇率波动等因素。如果AI只是给出一个"最优方案"，而没有解释为什么这个方案是最优的，用户可能会觉得"你们只是想让我用你们的产品"。真正优秀的智能客服，应该能理解用户的真实意图，给出方案的同时解释依据，并允许用户进一步追问。

另一个高频被吐槽的问题是"智能推荐"变成"精准骚扰"。大模型赋能的个性化推荐在银行App中广泛用于控制产品营销，但用户体验研究表明，当推荐算法无法准确判断用户真实意图时，"智能推荐"极易演变为"精准骚扰"。例如某银行App根据用户浏览过某理财产品，随后连续7天在首页推送同类产品，导致用户产生"被监控"的反感情绪。问题不在于算法不够先进，而在于体验设计未给用户留有"拒绝被智能"的控制感。

这不是技术问题，而是体验设计问题——AI不知道用户的真实意图，只是根据行为模式做出判断，而这种判断在某些场景下会让用户感到"被冒犯"。好的推荐应该是"推而不扰"，即用户能看到推荐但不被打扰；而不是"推而必扰"，用户每次打开App都被同样的推送刷屏。银行需要设计更精细的推荐策略，比如：用户只是浏览了产品页面，不应该触发连续推送；用户浏览后停留时间较长或查看详情，才可以考虑推送；推送频率要有上限，不能超过每天一次或每周三次。

还有一个深层的体验断点出现在复杂业务场景中。银行App中涉及多步骤、跨模块的业务（如对公账户开立、跨境汇款、信贷申请），大模型目前主要解决的是单一环节的智能化（如智能填写、智能审核），但跨环节的连贯体验仍然依赖用户自己"连"。用户体验测试表明，在大模型加持下，单个环节的效率确实提升了，但整体任务完成路径并未显著缩短——局部智能并未带来全局体验的系统性提升。

三. 为什么体验鸿沟会存在

要理解为什么技术越先进、体验鸿沟反而越宽，需要从银行组织内部的设计逻辑入手。凡景体验咨询通过调研和对比研究，梳理出五个结构性成因。这五个成因不是孤立的，而是相互关联的——它们共同构成了一个"体验鸿沟不断拉大"的系统性困局。

——第一个成因是技术指标与体验指标未对齐。当前银行大模型应用的评价体系，仍以"调用量""准确率""替代人工时长"等技术-效率类指标为核心。这些指标衡量的是"技术有没有用"，而非"用户觉得好不好用"。技术团队的KPI是"提升AI分流率"，但用户的KPI是"问题能不能解决"。当考核指标指向"调用量"时，技术团队会倾向于让AI"多回答问题"，而不是"多解决问题"。比如，AI可能会倾向于给用户提供"更多信息"，而不是"更精准的解决方案"——因为"信息量"可以被统计为"调用量"，但"问题是否解决"很难被量化。

凡景体验咨询在《以客户为中心打造差异化体验驱动银行财富管理服务模式创新》一文中曾指出，财富管理的核心竞争力是客户满意度（中国人民银行《金融从业规范财富管理》明确界定）。这一逻辑同样适用于AI大模型的体验评价——大模型应用的终极评价标尺，不是算力、参数、调用量，而是客户满意度。当银行的考核指挥棒指向"调用量"而非"满意度"时，体验鸿沟的扩大几乎是必然的。技术团队追求的是"AI分流率"，而用户关心的是"问题是否得到解决"。两个目标不一致，体验就很难真正改善。

——第二个成因是"智能化"设计的出发点仍然是"银行中心"而非"用户中心"。大模型在银行App中的功能设计，目前仍以"替代人工""降本增效"为主要目标。这导致智能功能的入口设计、交互逻辑、反馈机制都围绕"银行效率最大化"展开，而非"用户体验最优化"。一个典型的例子是：多家银行App将AI客服置于"第一时间接管"位置，用户无法快速转人工（需多次点击"转人工"才会触发）。从银行视角看，这提升了AI分流率；从用户视角看，这增加了"被AI困住"的挫败感。两个视角得出的体验评价完全不同。银行觉得自己是在"用AI提升服务效率"，用户觉得银行是在"用AI省钱，根本不在乎我的问题有没有解决"。

——第三个成因是缺乏"用户可控"的智能边界设计。优秀的智能体验，应该让用户始终感受到"可控感"——知道AI在做什么、可以纠正AI的错误、可以在AI与人工之间自由切换。目前银行App中大模型功能的交互设计，普遍存在"黑盒化"问题：AI给出了建议，但用户不知道建议的依据是什么；AI犯了错误，用户不清楚如何反馈纠正；AI处理失败后，用户需要重新开始，而非"接着AI没做完的地方继续"。这种失控感会使用户对"智能"产生抵触心理，甚至刻意避开AI功能。用户会觉得：既然AI帮不上忙，还浪费时间，那不如一开始就直接找人工。

——第四个成因是组织协同的"智能孤岛"。银行内部大模型应用通常由科技部或数字金融部牵头，而用户体验优化由网金部或客户体验部门负责。两个条线目标不同、考核不同、协同成本较高，导致"技术落地"与"体验优化"往往是"各干各的"。技术部门关注的是"大模型能否跑通这个场景"，体验部门关注的是"用户在这个场景下是否顺畅"。如果缺乏跨部门的用户体验协同机制，技术越先进，体验鸿沟反而可能越大。因为技术部门在不断做"加法"（增加智能功能），但如果没有体验部门的"减法"（优化冗余流程），用户面对的复杂度反而上升了。结果是银行觉得自己"AI能力越来越强"，用户觉得"App越来越难用"。

四. 缩小体验鸿沟的几点建议

凡景体验咨询基于对各银行App用户体验的持续跟踪研究，结合2025-2026年大模型应用的最新实践，提出以下建议，仅供银行体验部门和设计从业者参考。这些建议不是"锦上添花"，而是"必须要做"的基础性工作——如果这些问题不解决，大模型应用得再多，用户体验也很难真正改善。

第一个建议是建立"以客户满意度为核心"的大模型体验评价体系。建议银行在现有技术指标（调用量、准确率、替代工时）基础上，增加用户体验类指标：任务完成率（用户在大模型辅助下，是否真正完成了目标操作）、NPS净推荐值（用户使用该智能功能后，是否愿意推荐给他人）、人工转接率（有多少用户在AI交互后仍然选择转人工，这个比例反映AI实际解决能力）、用户可控感评分（用户是否能理解AI的决策依据，是否能方便地纠正AI错误）。

部分头部银行已在年报中提及对用户体验的重视，但这方面的制度建设仍有较大提升空间。评价体系变了，优化方向才会变。如果考核指标只是"调用量"，那AI的优化方向就是"让用户多问问题"；如果考核指标是"解决率"，那AI的优化方向才会变成"真正解决问题"。

第二个建议是在体验设计层面给用户"智能控制权"。具体可采取以下设计策略：一是可视化的AI决策依据，当AI给出理财建议或风控判断时，以简洁语言说明依据（如"根据您近6个月的资产结构和风险测评结果，建议……"），而非只给结论；二是无缝的人机切换机制，用户随时可以"打断AI"并转人工，且人工坐席能看到AI已经处理到哪一步，避免用户重复描述问题。

招商银行在部分对公场景中已实现AI与人工坐席的上下文继承，这一实践值得在零售端推广；三是用户可定义的"智能边界"，允许用户设置AI介入的程度（例如"仅在我询问时回答"vs"可以主动推荐"），而非强制所有用户接受统一化的"智能服务"。让用户有选择权，比给用户更多功能更重要。用户不喜欢"被智能"，用户喜欢的是"我用你的时候你帮我，我不想用你的时候你别烦我"。

第三个建议是以"客户旅程"为主线整合智能功能，而非以"技术能力"为主线。目前银行App的AI功能设计，多以"我们能做什么"为出发点（例如：我们有智能客服、智能投顾、智能风控，分别做成三个入口）。但用户并不关心"银行有什么技术"，用户只关心"我要完成什么任务"。

凡景体验咨询建议，银行应基于客户旅程地图（Customer Journey Map）重新梳理AI功能的呈现方式：以用户任务为主线（如"买房→贷款→还款"全流程），在旅程的关键触点嵌入智能化能力，而非让用户自己去"找"AI功能。建设银行在2025年年报中提到的"授信审批全流程AI应用"，正是向"旅程智能"方向迈进的有益尝试。用户不需要知道"你们有智能投顾"，用户只需要在考虑提前还款时，App主动告诉他"提前还10万能省多少利息"。

五. 最后几句话

AI大模型"装进"手机银行App，是银行业数智化转型的重要里程碑。但技术的归技术，体验的归体验——大模型可以让银行变得更"聪明"，但只有以客户为中心的体验设计，才能让用户感受到"聪明"的价值。

凡景体验咨询认为，2026年是银行业大模型应用从"技术验证"走向"体验验证"的关键窗口期。那些能够率先建立"技术+体验"双轮驱动机制的银行，将在下一阶段的客户体验竞争中占据主动。智能体验的鸿沟，不是技术填不平，而是体验设计还没跟上来。（完）