OpenClaw 类产品在资管行业的思考-夜雨聆风

OpenClaw 类产品在资管行业的思考

引言

资管行业对大模型的热情，已经过了最初的兴奋期。

前两年，大家看的是模型榜单、发布会、PPT架构图。一个模型能总结研报、写会议纪要、回答几个投研问题，就足以让人觉得“这东西要改写行业”。那时候，很多讨论停留在模型能力本身：上下文有多长，推理有多强，写作是否流畅，代码能力排第几。

人工智能进入深水区以后，真正卡住人的问题，并不只是“模型够不够聪明”。

一线人员要么抵触，要么不懂，要么觉得这东西在增加自己的工作负担。很多研究员不是不认可人工智能，而是不知道它在自己的工作里到底该怎么用。他们每天要看报告、跟公司、写点评、盯组合、回需求，本来就够忙。突然多出一个需要自己反复调提示词、反复验证答案、反复纠错的新工具，对他们来说不是“智能化”，而是“又多了一件事”。

领导层则几乎无一例外在加大人工智能投入。预算在批，项目在立，会议在开，供应商在进场，大家都希望看到效果。问题在于，上下并没有真正对齐。领导层要的是战略成果，一线要的是别添乱；技术团队要的是平台能力，业务团队要的是明天就能少干半小时活；厂商要讲大故事，使用者只关心字段能不能抽准、来源能不能点回去、出错之后能不能查。

这就是人工智能现在最真实的现状。

资管行业天然不是一个适合随便生成的行业。它要审计，要留痕，要权限，要口径，要复核，要责任人。它的很多判断不是一句自然语言回答，而是数据、模型、规则、经验、合规和组织流程共同作用的结果。

它代表的不是一个单点工具，而是一类工程范式：实际操作、跨会话记忆、工具调用、底层代码介入、任务编排、日志留痕和权限控制。它不是让大模型坐在中央发号施令，而是把模型放进一条可控的业务流水线里。

在资管场景中，模型可以负责非结构化文本解析、研报总结、事件识别、候选判断和自然语言交互；但指标计算、压力测试、权限校验、审计追踪，必须交给代码、数据系统和规则引擎。

这才是人工智能真正的方向：不是更拟人的聊天机器人，而是高度确定、可审计、可替换、可嵌入核心工作流的分布式计算节点。

大模型的下半场，不是技术神话，而是工程苦活。不是谁把故事讲得更大，而是谁能把一个窄场景做深、做稳、做出投入产出。不是谁的模型更贵，而是谁能用更低的成本、更强的约束、更清晰的数据血缘，把不确定的智能压进确定的业务流程里。

模型选择的祛魅

任务层级	适合方式	成本逻辑	风险控制
大规模摘要与初筛	低成本模型批量处理	调用频繁，必须压低单次成本	保留原文引用，抽样复核
复杂推理与高价值判断	强推理模型辅助分析	低频但价值高，可以使用更高等级模型	结论不直接入账，必须有人确认
结构化字段抽取	专门模型或规则增强模型	字段稳定后可规模复用	结构校验、枚举约束、异常回退
敏感资料处理	私有部署或内网模型	合规优先于单次体验	权限隔离、日志留痕、访问审批
组合风险与估值计算	代码引擎和规则引擎	不应由生成文本直接计算	可重算、可回放、可解释

模型分层选型示意

国内很多投研人员和研发团队，在模型选型时天然偏向国外的大模型。尤其是在长文本处理、复杂文档理解、代码辅助和材料总结场景里，Claude经常被视为“默认最diao”的选择。

这种偏好不是没有原因。Claude在长文本阅读、语义理解、写作流畅度和复杂材料压缩上确实表现很强。对于很多研究员来说，它的直接体验往往好于不少国产模型。把一篇长研报扔进去，让它提炼逻辑、归纳假设、梳理风险点，体验很顺。让它辅助写代码、重构脚本、解释报错，也确实省事。

但资管生产系统不能只看单次体验。

单次问答体验好，不代表长期运行成本能接受。长文本能力强，不代表财务计算一定准确。模型回答漂亮，不代表结果可以审计。闭源模型强，不代表系统护城河就在模型本身。

资管场景不是个人临时问答，而是高频、批量、长链路、强约束的生产任务。一旦进入生产，成本和可控性会立刻变成核心问题。

海外开发者和企业应用里，对qwen、deeseek、kimi系列等开放或低成本模型的使用增长很快。这里面没有太多信仰，更多是账本太清楚。OpenRouter基于 100 万亿Token的真实调用研究显示，开源/开放权重模型在实际调用中已有相当规模，智能体式推理也在上升；抱抱脸 2026 年春季开源报告也显示，中国模型在开源生态中的下载占比和影响力快速提升。

这不意味着海外所有人都不用Claude、ChatGpt模型或Gemini模型。恰恰相反，闭源强模型仍然是很多高价值任务的核心选择。更准确的判断是：在真实工程落地里，海外开发者越来越不迷信单一最强模型，而是按任务、成本、速度、部署方式和可替换性来选模型。

智能体一旦跑起来，消耗的不是一次提示词，而是持续不断的Token。

一个投研智能体要读公告、读财报、读新闻、读研报、调接口、做重试、做校验、写日志。一个看起来很小的任务，如果乘上几千个主体、几百只产品、几十个行业、每天多轮更新，Token消耗会迅速放大。

资管行业尤其如此。

固收评级公告是Token。上市公司财报是Token。卖方研报是Token。路演纪要是Token。舆情新闻是Token。知识库召回是Token。失败重试还是Token。

如果所有任务都用最贵的闭源模型，很多场景根本跑不出投入产出。

可以用固收投研做一个粗略测算。

假设一家机构覆盖 5000 个发债主体，每个主体每天新增公告、新闻、评级材料、财报更新、舆情信息等文本，平均按 2 万Token处理量计算，单日输入就是 1 亿Token。再考虑多轮抽取、结构化修复、结构化数据输出、异常重试、交叉校验、日志留存、高风险事项二次确认，实际Token成本会继续放大。

这时候，模型价格差异就不是小数点问题，而是系统能不能长期跑下去的问题。

Deepseek官方价格显示，其常规输入、输出Token成本远低于Claude高端模型价格区间；Anthropic公司官方价格显示，Claude中端系列和高端系列系列在每百万Token的输入、输出价格上明显更高。这不是说低成本模型一定更好，而是说不同任务必须分层。顶级闭源模型适合做高价值、低频、强推理任务；低成本模型更适合承担大规模、可校验、可分层的基础处理任务。

人工智能的模型路线，不能按“谁最聪明”选，而要按“这个任务链路里谁的性价比最高、错误最可控、替换成本最低”选。

真正的护城河也不在某个模型上。

一个资管机构如果把全部能力绑定在某个闭源模型上，很快会遇到几个问题：成本不可控、输出风格漂移、接口策略变化、数据出境合规、供应商依赖、模型升级后的回归测试。模型越强，绑定越深，未来迁移成本越高。

OpenClaw 类产品的价值在这里就很明显。

它应该允许机构把不同模型放在不同位置：摘要任务用便宜模型，复杂推理用强模型，结构化抽取用专门模型，敏感数据用私有部署模型，高频批处理用低成本模型，高风险输出进入人工复核。

模型只是一个可替换部件。真正的系统能力在调度、校验、权限、血缘、代码和审计里。

比如，固收评级公告的处理，可以让模型负责识别主体、债项、评级动作、展望变化和关键措辞；但评级迁移矩阵、估值压力测试、组合敞口计算，必须交给脚本语言或后端语言指标引擎。模型抽出结构化数据，代码负责计算，规则引擎负责校验，风控系统负责推送，日志系统负责留痕。这样，即便模型在某些字段上有误差，也可以通过规则、校验和人工复核把风险压住。

模型选择的祛魅，是人工智能进入深水区的第一步。

模型成本与使用热度对比

伪需求泛滥与窄场景突围

判断标准	含义	资管示例	验收方式
窄	输入、输出、责任边界清楚	提取公告中的提前赎回条款	字段准确率、原文定位率
硬	规则复杂，人工处理麻烦	评级变动与展望变化识别	规则覆盖率、异常召回率
频	持续发生，值得固化流程	每日舆情与公告扫描	每日节省时长、漏看下降
贵	人力贵、风险贵、出错贵	组合异常归因与风控提醒	误报率、漏报率、处置时效

真场景筛选标准

现在很多人工智能项目失败，不是模型失败，而是场景失败。

厂商拿着大模型找钉子。甲方拿着战略口号找项目。研发拿着平台能力找使用者。业务一线拿着真实痛点，却很难把它翻译成系统需求。

于是项目会上充满大词：智能投研、智能风控、智能运营、智能中台、多智能体协同、投研大脑、金融智能体平台。

但一到落地，就发现很多问题没有答案。

输入是什么？输出是什么？谁来用？错了谁负责？节省多少时间？减少多少风险？验收标准是什么？

没有这些答案，再复杂的智能体都只是演示系统。

“智能投研助手”这种场景听起来非常正确，但很难落地。原因很简单：它太宽。

投研不是一个动作，而是一组复杂动作：看材料、建假设、调数据、做模型、比同行、看估值、听路演、跟组合、控风险、写报告、做汇报。任何一个环节都可以拆出一堆子任务。如果一上来就做“全能投研助手”，系统很快会失控。

输入不稳定，输出不可验，价值说不清，责任边界模糊。

越宽的场景，越容易变成概念。越窄的场景，越可能形成产品。

人工智能真场景至少要满足四个标准：窄、硬、频、贵。

窄，是输入输出边界清楚。比如“提取 50 份公告里的提前赎回条款”，就比“帮我研究这家公司”清楚得多。

硬，是业务规则复杂，人工处理麻烦。比如固收主体评级变动、债券条款识别、交易型开放式指数基金申赎清单核对、组合异常归因。

频，是每天、每周、每月持续发生，而不是一年发生一次。

贵，是人工时间贵，或者出错代价高，或者漏看风险贵。

总结成一句话：窄场景 + 必需品。

交易型开放式指数基金、指数增强、FOF、量化组合都有大量重复核对工作：成分券、权重、申赎清单、估值、停复牌、公司行为、行业分类、风险暴露、持仓偏离。

这些工作高度重复，却不能出错。人工智能可以承担信息整理、异常识别、跨系统比对和差异清单生成，但最终确认仍然由人完成。

这类场景的价值非常直接：减少漏看、错看、晚看。

很多时候，人工智能的价值不是“生成观点”，而是减少业务里的摩擦。少一次人工复制，少一次表格比对，少一次公告漏看，少一次口径不一致，少一次临时翻材料，这些都是真价值。

所以，不要从“人工智能能做什么”出发。要从“业务每天最烦、最怕、最贵的环节”出发。

人工智能的突破口不是大而全，而是小而硬。不是万能助手，而是一个个能跑出投入产出的窄场景节点。

基础功能高频使用

前台入口	后台能力	业务价值	不要暴露给用户的复杂性
研报总结	文档解析、观点抽取、历史对比	减少阅读与整理时间	向量召回、主体链接、任务编排
每日舆情推送	信源过滤、去重聚类、持仓映射	扩大信息覆盖，减少漏看	实体消歧、主题跟踪、异常升级
公告字段提取	条款识别、结构化输出、证据回链	提高运营和投研核对效率	格式修复、规则校验、错误回放
投资假设变化追踪	前后报告对比、假设识别、冲突提示	帮助研究员发现观点迁移	历史版本管理、引用追踪

前台克制、后台深入的产品拆解

如果把现在资管机构内部的大模型使用情况摊开看，会发现一个很有意思的反差。

会议室里讲的是多智能体协同、自动投研流水线、智能风控闭环、端到端投资决策辅助。真正落到业务一线，使用最多的却是一些非常基础的功能。

研报总结。网页总结。公告摘要。知识库总结。会议纪要整理。材料初稿生成。舆情新闻收集。行业数据归纳。宏观信息跟踪。

这些能力并不复杂，甚至可以说是大模型最早被验证的一批基础能力。

投研人员并没有大规模使用复杂智能体。他们更多是在让模型帮自己少读一点、快读一点、先整理一遍。

一篇 80 页深度报告，先压成 2000 字。一个行业过去一周新闻，先按公司和主题分组。一个政策文件，先提取关键条款和影响范围。一批公告，先筛出可能跟组合相关的事件。

这就是当前投研人工智能的真实底色：基础能力最先被用起来，复杂智能体还停在演示、试点和想象里。

基础功能高频，不是因为业务人员没有想象力，而是因为它们符合投研工作节奏。

它们不改变责任边界。模型总结研报，研究员仍然自己判断。模型整理舆情，业务仍然可以复核。它只是助手，不是决策者，使用者心理压力小。

它们不强行改造工作流。研究员本来就要看报告、看公告、看新闻，现在只是多一个预处理工具。它没有要求业务把整个投研流程迁移到一个陌生平台里。

它们错误代价相对可控。摘要不准可以回原文，知识库回答不确定可以看引用，新闻遗漏可以补查。它们不直接触发交易，不直接改变估值，不直接影响组合风险暴露。

它们价值马上能感知。少读 20 页，少翻 10 个网页，少整理半小时纪要，这种收益非常直接。相比之下，“智能投研大脑”听起来更宏大，但很难在当天证明自己值钱。

所以，基础功能并不低级。它们只是刚好卡在“有帮助但不越权”的位置。

问题在于，业务最常用的是基础功能，厂商和研发却往往按最复杂、最炫目的能力来设计系统。

一线只是想要一个稳定的研报摘要工具，系统设计却上来就是多智能体自治协作框架。业务只是想定时收集行业新闻，架构图里却出现了感知层、认知层、规划层、执行层、反思层。投研只是想从几十份公告里提取几个字段，方案却开始讲面向未来的通用人工智能投研操作系统。

这中间有巨大的错位。

厂商需要讲大故事。简单的摘要、检索、收集，听上去不像一个大项目，撑不起预算，也撑不起发布会。所以方案必须往大了讲，最好是平台化、生态化、智能化。

研发也容易被复杂架构吸引。工程师天然喜欢设计更通用、更抽象、更可扩展的系统。只做一个公告摘要模块，显得不够高级；做一个多智能体编排平台，才像是在解决未来问题。

甲方管理层也容易被宏大叙事打动。一个“智能投研助手”听起来平平无奇，一个“资管行业大模型中枢”听起来就像战略工程。

但业务一线并不为这些词买单。它们真正关心的是：明天早上能不能把我要看的东西整理好？字段能不能抽准？引用能不能点回原文？出错之后能不能查出来？系统能不能别让我多干活？

这就引出一个关键问题：既然现在业务使用最多的只是总结、检索、舆情收集这些基础能力，是不是说明不需要钻研更深入的智能体能力？

答案恰恰相反。

基础功能高频使用，只说明当前业务对人工智能的接受方式还停留在低风险入口，并不说明深层能力没有价值。真正的问题是，复杂能力不能为了复杂而复杂，必须藏在简单功能背后，替业务承担那些看不见但很重的工作。

看似只是“研报总结”，背后其实可以继续往下钻：是否识别了报告中的核心假设？是否提取了盈利预测变化？是否和前次报告观点发生冲突？是否能追踪分析师对同一公司的判断变化？是否能关联组合持仓和风险敞口？是否能判断这篇报告对现有投资假设有没有冲击？

看似只是“舆情新闻收集”，背后也可以很深：新闻是否涉及持仓主体？是否影响信用评级？是否涉及上下游传导？是否与历史风险事件相似？是否需要触发风控提醒？是否应该进入主体画像和事件库？

所以，基础入口不代表浅层能力。真正优秀的系统应该让前台看起来简单，后台越来越深。

用户看到的是一个“总结按钮”，后台跑的可能是文档解析、知识召回、主体识别、事件分类、指标关联、历史对比、风险评分和审计留痕。用户看到的是一个“每日舆情推送”，后台跑的可能是信源过滤、去重、聚类、实体链接、主题跟踪、组合映射和异常事件升级。

这才是投研人工智能应该走的方向：前台克制，后台深入。

投研人工智能产品不应该把复杂性暴露给用户。业务人员不需要知道后面有几个智能体，也不需要理解任务规划、工具调用、反思机制和向量召回。

业务人员只需要看到几个稳定入口：总结这篇研报；提取这些公告里的关键条款；每天推送我关注行业的变化；发现持仓主体的异常事件；对比这家公司前后两次评级变化；把这批材料整理成尽调提纲；标出这份报告里影响投资假设的内容。

入口越简单，越容易被使用。后台越扎实，越能形成壁垒。

OpenClaw 类产品应该发挥的作用，不是把复杂能力堆在前台，而是在后台把模型、工具、代码、数据、权限、日志、审计串起来。让业务用起来像一个按钮，让系统跑起来像一条生产流水线。

当前投研人工智能的现实并不复杂：业务高频使用的是最基础的材料处理和信息收集能力，复杂智能体还没有真正大规模进入核心工作流。

但这不意味着行业不需要深入能力。恰恰相反，越是前台简单，越要求后台深。

真正有价值的系统，不是让用户感受到复杂，而是替用户消化复杂。

海外资管都在做什么

目前使用人工智能的投资流程领域

把视角拉到海外，会发现一个重要现象：海外资管和财富管理机构讲人工智能，也讲智能体，也讲助手，也讲下一代投资基础设施，但真正落地的场景并没有那么炫酷。

它们没有大规模把人工智能放到“自动替基金经理做投资判断”的位置上，也没有让一个智能体从宏观、行业、公司、估值、交易一路自动跑到底。

海外更务实。人工智能主要被放进几个高频、低越权、可审计、能量化效率的环节：投研信息处理、风险分析、组合解释、客户沟通、股东投票和治理、金融数据终端、后台运营自动化。

这说明，海外也没有跳过基础阶段。只是它们更早意识到：人工智能的价值不是先去挑战投资决策权，而是先吃掉投研和运营链路里最耗人的信息处理工作。

安永 2025 年对财富与资产管理机构的调研显示，95% 的机构已经把生成式人工智能扩展到多个用例，78% 在探索智能体式人工智能，但只有略高于四分之一的高管认为已经产生显著业务影响；比较明确的早期收益集中在合规、风险管理和信息技术基础设施效率上。美世 2024 年投资管理调研也显示，91% 的管理人正在或计划在投资策略、资产类别研究中使用人工智能，但它更多是在增强研究、扩展数据和辅助生成想法，而不是直接接管投资决策。

这两个数据放在一起，很有意思。

一方面，人工智能确实已经进入海外资管行业。另一方面，它并没有像营销话术里说的那样，迅速变成“自动创造超额收益的机器”。它先变成了效率工具、解释工具、材料工具、检索工具、运营工具。

彭博、金融数据服务商、晨星这类数据和投研工具厂商，最先强化的是研究材料处理。

彭博的人工智能能力围绕终端展开，帮助用户更快处理新闻、公司文档、研究材料、财报电话会和市场数据。它的人工智能新闻摘要能力强调从大量新闻源里提炼与用户覆盖公司相关的信息。金融数据服务商的电话会记录助手、组合评论助手等功能，则围绕电话会摘要、管理层指引提取、组合表现解释和归因文字化展开。晨星的智能研究解决方案和智能顾问助手，则把人工智能放进研究、筛选、组合分析和顾问工作流里。

这些案例说明，海外最先打穿的不是复杂智能体，而是“材料理解 + 数据检索 + 工作流内嵌”。

这和国内投研当前高频使用研报总结、网页总结、知识库总结并不矛盾，反而高度一致。差别只在于，海外厂商更强调把基础能力做深。不是总结一篇报告就结束，而是让总结结果能连接原文、连接数据、连接组合、连接风控、连接客户沟通。

贝莱德的阿拉丁和明晟的相关产品，则代表风险和组合分析方向。

阿拉丁助手被放在阿拉丁平台内部，强调通过生成式人工智能连接平台能力、提升效率、加快获取行动信息，同时明确强调权限、数据隐私和风险控制。这类产品的关键，不是让人工智能重新发明风险模型，而是在既有风险模型、组合数据、市场数据和客户偏好上加一个自然语言解释层。

人工智能做的是翻译、归纳、解释和连接。它不是风险模型本身，也不是最终风险负责人。

这种定位很重要。在资管行业，很多系统原本已经有成熟的数据和计算引擎。人工智能不应该绕过这些系统重新算一遍，而应该帮助人更快理解这些系统的输出。

比如，为什么今天组合波动放大？主要风险暴露来自哪里？哪个行业或因子贡献最大？这段组合表现该如何向客户解释？异常波动是否需要升级？

人工智能在这里的价值是提高解释效率和沟通效率，而不是替代风险判断。

财富管理是海外生成式人工智能落地很快的领域。原因很简单：顾问和客户之间有大量重复性的材料准备、会议纪要、邮件撰写、市场观点解释、组合评论和客户触达工作。

摩根士丹利的人工智能 @ 摩根士丹利会后整理是典型案例。它在客户同意的前提下，为财务顾问生成会议纪要、行动项和邮件初稿，并把记录保存到客户关系管理系统。这个场景不需要证明人工智能能不能创造超额收益，只需要证明人工智能能不能让顾问少写材料、少翻资料、少做会后整理。摩根士丹利公开案例中也提到，人工智能助手在财富管理条线获得了很高采用率，并提升了文档检索效率。

这类场景最容易证明价值。时间节省很直接，用户感知也很直接，风险边界相对清楚。

人工智能在资管行业的早期价值，往往不是先出现在投资决策端，而是出现在材料生产端、客户服务端和流程协同端。

海外一些大机构还把人工智能放进治理和合规流程。比如股东投票、公司治理、代理投票、合规监控、风险报告。这类场景不性感，但非常适合人工智能工程化。

因为它们具备几个特点：流程清楚、材料量大、规则明确、审计要求高、人工成本高。人工智能在这里不是自由发挥，而是帮助机构把外部材料、内部规则、历史决策和审批流程串起来。

金融数据终端和平台厂商的趋势也很明显：大家都在争夺下一代人工智能工作入口。

彭博把人工智能嵌入终端。金融数据服务商把人工智能嵌入工作台和研究、组合工具。晨星把人工智能嵌入直接平台和顾问平台。伦敦证券交易所集团与微软合作，让授权金融数据进入微软办公助手、助手工作室和模型连接协议工作流。贝莱德把人工智能放进阿拉丁生态。

它们争的不是谁做一个更会聊天的机器人，而是谁能成为金融专业人士每天打开的第一个人工智能工作台。

过去金融数据终端的壁垒在数据覆盖、权限、速度和专业函数。未来的壁垒会变成：数据 + 工作流 + 人工智能交互 + 权限 + 审计。

谁掌握专业数据，谁更容易让人工智能给出可信答案。谁掌握工作流，谁更容易让人工智能被真正使用。谁掌握权限和审计，谁更容易进入机构生产环境。

那么，海外人工智能到底有没有产生价值？

答案是：有，但价值分布并不均匀。

已经比较明确的价值，集中在四个地方。

第一，节省时间。总结电话会、归纳研报、写会议纪要、生成客户邮件、解释组合归因，这些工作原来都靠人堆时间，现在人工智能可以压缩处理周期。

第二，扩大信息覆盖。研究员和顾问不可能每天读完所有公告、电话会、新闻和报告。人工智能可以扩大扫描半径，让人更早发现线索。

第三，提高材料生产效率。客户沟通、组合评论、市场摘要、会议跟进、内部报告，都是文字密集型工作，人工智能的边际收益明显。

第四，强化流程控制。在投票治理、合规监控、运营自动化、风险报告这些环节，人工智能如果嵌入既有系统，就能减少人工搬运和流程断点。

但还没有被充分证明的，是人工智能能不能稳定创造投资超额收益。

这点必须讲清楚。海外大机构并没有普遍宣称“人工智能已经替基金经理赚钱”。更多公开案例指向的是效率、覆盖、解释、沟通和治理。美世 2026 年文章也提醒，资产管理人使用人工智能的程度差异很大，投资者需要分清哪些是真正进入生产、哪些仍在试点，并且它看到的主要可衡量收益更多是运营效率和更快、更高质量的洞察，而不是收益率直接改善。

效率不必然转化成超额收益。读得更快，不代表买得更准。材料写得更快，不代表组合表现更好。

人工智能对投研的价值是真实的，但不能把效率价值直接包装成超额收益价值。

这里还要补一个关键判断：今天做人工智能治理，外部环境其实比过去做数据治理时要好。

过去很多机构推进数据治理，业务不愿意配合。原因很现实：数据治理听起来像后台工作，短期收益不明显，业务只觉得要填字段、改流程、补口径、做检查，增加了额外负担。

人工智能治理不一样。

今天领导层更重视人工智能，预算更容易批，组织层面也更愿意给资源。大模型的使用效果更容易被一线感知，业务也能直观看到总结、检索、材料生成带来的效率变化。

这意味着，人工智能治理天然拥有比当年数据治理更好的推进窗口。

但窗口不等于落地。

如果业务只是把人工智能治理理解成“技术部门的事”，那它仍然会失败。因为人工智能治理管的不是模型本身，而是业务如何使用模型。

哪些数据能进模型？哪些结果必须人工复核？哪些场景不能自动执行？哪些输出必须保留证据？哪些任务可以低成本模型处理？哪些任务必须使用高等级模型？哪些回答必须引用原文？哪些日志需要留存？哪些错误需要回放？

这些问题都不是纯技术问题。它们必须由业务、风控、合规、技术共同定义。

AI治理比数据治理更容易获得关注，但也更容易流于表面。只有业务真正参与，把场景、责任、权限、口径、复核和验收标准说清楚，AI治理才可能落地。

海外案例的几个启发。

第一，不要一上来做全能投研大脑。海外真正落地的场景，大多是窄场景、强工作流、可审计场景。

第二，人工智能要嵌进原有业务系统，而不是另起一个聊天入口。摩根士丹利、贝莱德、金融数据服务商、彭博、晨星的共同点，都是把人工智能塞进顾问、研究员、风险经理已经在用的系统里。

第三，价值先从效率来，再谈超额收益。能不能节省研究员时间、减少运营错误、提高客户沟通效率、扩大舆情覆盖，这些更容易被衡量。

第四，复杂能力要藏在简单入口后面。用户看到的可以只是“总结电话会”“生成组合评论”“准备客户会议”“解释风险归因”，但后台必须有模型路由、数据权限、引用追踪、工具调用、日志留痕和人工复核。

第五，数据和工作流比模型更重要。彭博、金融数据服务商、明晟、伦敦证券交易所集团、晨星之所以能做人工智能，不只是因为它们调用了大模型，而是因为它们手里有专业数据、客户工作流和长期沉淀的权限体系。

海外资管和财富管理公司围绕人工智能做的事情，其实没有那么神秘。

它们做的不是让人工智能接管投资，而是让人工智能先接管信息处理、材料生产、组合解释、客户沟通、风险分析、投票治理和后台运营。

这些场景已经产生价值，但主要是效率价值、流程价值和覆盖价值，不是已经被大规模证明的超额收益价值。

这恰恰印证了人工智能的现实路线：先不要把人工智能神化成投资大脑，而要把它工程化成工作流组件；先不要追逐最复杂的智能体，而要把高频、刚需、可审计的窄场景打穿；先不要急着证明人工智能能替人赚钱，而要先证明它能替人少浪费时间、少犯低级错、少漏掉关键变化。

体验降级与过度设计

很多系统接入人工智能后，用户体验至少下降三成。

不是人工智能没用，而是设计者把所有交互都塞进了聊天框框。

过去一键导出的报表，现在要写提示词。过去确定性的筛选，现在要等模型生成。过去错误一眼能看出，现在要担心幻觉。过去系统按钮清晰，现在变成“你问我答”。过去 1 秒完成，现在要来回追问三轮。

聊天框是演示时代最好的外壳，也是生产时代最重的包袱。

消费级应用里，聊天框很好。因为用户需求不稳定，问题很宽，答案可以发散。可资管系统不是这样。资管业务的很多动作是重复的、确定的、有格式的、有责任边界的。用户不是来和系统聊天的，用户是来完成任务的。

如果一个原来点一下按钮就能完成的任务，被改造成“请描述你的需求”，那就是倒退。

业务一线只想要“把 50 份公告里的提前赎回条款提出来”，厂商却给了一套“自治多智能体投研平台”。业务只是要定时收集行业新闻，系统却设计成多层感知、多层推理、多层反思。研发和厂商按照最复杂、最炫、最屌炸天的能力来设计系统，但业务每天使用的可能只是基础到不能再基础的功能。

这就是当前最大的问题：系统越来越抽象，业务越来越沉默。

很多人工智能产品有一种天然冲动：把能力都露出来。最好让用户看到模型在思考，看到智能体在规划，看到工具在调用，看到多轮任务在执行。这样看起来很智能，也方便演示。

但真正生产环境里，用户并不关心这些。用户只关心结果是否准确、证据是否清晰、操作是否省事、出了问题能不能查。

企业级智能体不应该首先是一个聊天框，而应该是一个API接口。

前端保留原来的业务系统入口。用户点击“生成摘要”“核对条款”“触发压力测试”。后台智能体自动完成抓取、解析、计算、校验、推送。用户只看到结果、差异、证据和建议。

真正好的人工智能，不应该让用户学习怎么跟它说话，而应该让用户少说话。

同样处理 50 份公告，聊天框方式可能需要 3——4 轮提示词，耗时 5 分钟以上，还要人工核查格式。后台智能体接口可以在用户点击任务后静默运行，返回结构化结果和引用证据。用户只复核异常项，不再参与模型对话。

这就是产品设计的分水岭。前者让人适应人工智能，后者让人工智能适应人。

资管系统不是消费级应用。它不需要人工智能更像人，而需要人工智能更像系统组件。

少一点聊天，多一点确定性。少一点拟人化，多一点工程化。少一点前台表演，多一点后台执行。

有了数据就有了智能吗

治理要素	没有治理时的风险	可落地做法
数据版本	新旧材料混召回，答案看似流畅但错误	有效版本标记、时间戳、废弃标识
指标口径	同一指标多种算法，结论冲突	口径字典、统一指标服务、计算留痕
权限边界	敏感资料进入不合适模型或被越权访问	角色权限、分级模型、访问审计
引用证据	摘要覆盖原文，无法复查	原文回链、页码定位、片段留证
输出责任	模型结论被误当作最终判断	候选生成与人工确认分离

检索增强生成与数据治理

行业里有一种危险幻觉：只要把研报、公告、持仓、行情、财务数据扔进向量数据库，智能就会自然长出来。

这是错的。

脏数据不会产生智能，只会产生更自信的错误。

没有治理的数据，进入模型以后并不会变干净。相反，它会被模型包装成更流畅、更像真的答案。传统系统里，脏数据看起来可能就是一个空字段、一个错误值、一个口径冲突。到了大模型里，它可能会被组织成一段非常完整、非常自然、非常难以第一眼识别的错误解释。

这就是金融场景最可怕的地方。

很多检索增强生成项目失败，不是模型差，而是知识库本身没有治理。

文档版本混乱。权限不清。时间戳缺失。指标口径冲突。新旧报告并存。字段无人维护。摘要覆盖原文。内部观点和外部材料混在一起。已废弃制度和现行制度没有标记。历史评级和最新评级没有区分。老版本产品合同和新版本合同都被召回。

没有数据治理的检索增强生成，本质上是一个带自然语言界面的垃圾场。

资管决策信号往往不是一个字段，而是几十张表、多个系统、多轮计算后的结果。

一个债券风险预警信号，可能来自评级公告、财报指标、舆情事件、成交偏离、组合持仓、行业风险、主体关联关系。

一个交易型开放式指数基金运营异常，可能来自指数成分、申赎清单、行情、估值、停牌、公司行为、托管行反馈。

一个组合风险归因，可能来自行情系统、估值系统、持仓系统、因子模型、交易系统、产品规则和风险限额。

如果数据来龙去脉不清，大模型生成得越流畅，风险越大。

人工智能不是把资料扔进去就完事。它需要数据血缘，需要版本管理，需要权限控制，需要口径统一，需要字段解释，需要任务日志，需要引用证据。

更重要的是，幻觉不能靠提示词根治。金融场景必须把模型锁进代码控制流。

模型只做文本解析、分类、摘要、候选生成。指标计算交给代码。口径校验交给规则引擎。数据访问交给权限系统。最终结果必须可追溯、可回放、可重算。高风险输出必须经过人工确认。

这才是高代码智能体的意义。不是让模型自由发挥，而是给模型划定边界。

OpenClaw 类产品框架的核心价值，也正在这里。它不应该只是把提示词链起来，而是要把模型能力嵌入一个受控的工程环境：每一次输入来自哪里、调用了哪个模型、用了哪些工具、访问了哪些数据、输出了什么结构化结果、经过了哪些校验、被谁确认、最后推送到哪里，都应该有记录。

只有这样，人工智能才能从“能用”走向“敢用”。

数据不是智能的充分条件。 “干净数据 + 血缘追踪 + 代码约束 + 模型解析”，才是人工智能的可用形态。

有了数据，不等于有了智能。有了可治理的数据，才可能产生可控的智能。

绝大多数智能体都会消亡

死亡原因	生产表现	治理对策
提示词链条脆弱	模型版本变化后输出漂移	结构化协议、回归测试、版本回放
工具接口不稳定	网页结构变化导致抓取失败	接口标准化、异常熔断、备用信源
权限与安全缺失	越权访问、敏感数据外流	工具白名单、沙箱执行、访问审批
场景不刚需	演示好看但没人长期使用	从高频刚需节点切入
没人维护	试点结束后持续坏掉	明确责任人、监控面板、迭代机制

智能体消亡原因与生产治理对策

现在大部分智能体都会死，而且死得并不冤。

提示词链条太脆。工具接口不稳定。网页结构一变，抓取失败。模型版本一换，输出格式漂移。权限和安全没设计。异常处理没做好。没有长期维护人。场景本身不刚需。

很多智能体在演示里很好看，但一进生产就露馅。它不是不能跑，而是不能长期跑。不是今天不能用，而是没人敢让它连续跑三个月。

资管业务尤其残酷。

一个公告抓取智能体，网页结构变一次，字段可能就错。一个研报总结智能体，模型升级后风格变化，输出格式可能不再适配下游系统。一个舆情智能体，信源质量不稳定，容易把噪声当风险。一个组合解释智能体，如果没有接准持仓和估值数据，生成的文字越漂亮越危险。

这就是为什么大多数智能体会死。

但即便如此，资管机构还是必须做。

因为死掉的是智能体实例，沉淀下来的是数字基础设施。

在试错过程中，机构会被迫完成过去多年没完成的基础工程：清理非标文档，梳理业务流程，标准化内部接口，显性化隐性投研逻辑，建立数据血缘，建立日志和审计，重构权限体系，培养懂业务也懂工程的人。

智能体死亡不是终点，而是筛选机制。不刚需的会死，真痛点会留下，真正有价值的流程会被越做越深。

很多机构过去做数字化，最大的问题是业务不愿意把流程说清楚。因为说清楚很麻烦，改系统很麻烦，维护字段更麻烦。现在人工智能项目一进来，很多旧账躲不掉了。

你要让模型读文档，就必须先知道哪些文档是有效版本。你要让智能体调接口，就必须先把接口标准化。你要让系统自动推送风险，就必须先定义什么是风险。你要让模型生成结论，就必须先定义哪些结论需要复核。你要让人工智能参与流程，就必须先定义权限、日志和责任边界。

这就是焦土战的价值。

资管机构不能按“做一个机器人”的思路推进，而要按“建设智能体治理体系”的思路推进。

治理要素包括：模型路由、成本监控、工具权限、沙箱执行、日志留痕、人工复核、异常熔断、版本回放、数据血缘、合规审计。

没有治理的智能体，是一次性脚本。有治理的智能体，才可能成为生产系统。

智能体的价值，不在于第一个版本能活多久，而在于它逼着机构把业务系统变得更干净、更标准、更可编排。

99.99% 的智能体会死。但没有这场焦土战，资管机构也很难真正补上数字化基础设施的旧账。

小团队的逆袭

过去资管信息技术是重资产游戏。

系统采购贵，实施周期长，供应商绑定深，数据复杂，合规审批慢。大机构预算、人力和系统资源优势明显，中小私募、中小资管团队很难在传统信息技术军备竞赛中获胜。

但人工智能变量出现后，竞争结构变了。

小团队没有沉重历史系统包袱，决策链短，试错成本低，业务和技术距离近。它们可以快速接入低成本模型，可以用开源智能体框架快速搭原型，可以几天内验证一个窄场景，而不是花半年立项。

在人工智能这个高优变量下，很多事情不是该不该跟，而是跟不跟。

过去很多小机构会说：“我们规模小，没机会。” 但在人工智能场景里，小有时候反而是优势。

大机构的问题是流程长、系统重、审批慢、历史包袱多。一个小功能要进入生产，可能要过数据、安全、合规、架构、采购、业务多道关。小团队则可以围绕一个真实痛点快速试错，先做一个局部工具，先跑一个业务节点，先让三个人用起来。

当然，小团队也不能乱做。

正确路径不是一上来做大平台，而是先做一个刚需节点。先接低成本模型。不迷信聊天框，先封装后台接口。不做全流程自动化，先做人机协同。不追求一次成功，先追求每周迭代。不把智能体当项目，而把它当持续演化的工作流。

小团队的优势不是资源多，而是试错快。

人工智能深水区还会催生一种新型人才：极客研究员。

他们懂固收、权益、ETF、组合、风控；会写脚本语言、数据查询语言；能把隐性投研逻辑转成代码；知道模型什么时候该用，什么时候不能用；能把业务流程拆成可执行节点；能用人工智能编程工具快速搭出业务原型。

未来局部场景的优势，可能不是由大平台产生，而是由高密度的业技融合小团队产生。

小不是劣势。在人工智能时代，小可能意味着更快、更轻、更敢试。

轻资产、高密度、极客化的投研团队，有机会在局部窄场景上打出比大机构更快的迭代速度。

业技融合

阶段	业务人员状态	系统建设重点	衡量指标
熟悉人工智能	在低风险场景里建立手感	摘要、会议纪要、研报初筛	使用频率、节省时长
了解人工智能	知道模型强弱边界	引用回链、人工复核、数据血缘	错误可定位率、复核通过率
掌握人工智能	能把流程拆成可执行节点	智能体工作流、任务调度、审计回放	投入产出、流程缩短、风险下降

人工智能认知跃迁路径

人工智能的破局，不靠某个神奇模型，也不靠一次性采购。

真正的破局点是执行纪律。

场景要窄。数据要清。模型要合适。流程要可审计。业务要参与。技术要落地。

大模型只是变量之一。真正决定成败的，是机构有没有能力把变量压进业务流程。

很多人工智能项目失败，是因为技术团队在展示能力，业务团队在旁边礼貌鼓掌，但没人真正愿意用。看起来大家都参加了项目，实际上需求没有被翻译清楚，流程没有被拆开，验收没有被定义，责任也没有被确认。

正确方式应该是：业务提出真实痛点，技术拆解流程节点，双方共同定义输入输出，共同定义错误边界，共同定义验收指标，共同维护版本迭代。

业技融合不是开几次需求会，而是让业务逻辑真正进入系统设计。

资管机构应该优先击穿刚需窄场景。

大多数资管机构也不需要花重金炼基础大模型。真正该投的是非标数据清洗、内部系统接口标准化、数据血缘、指标口径管理、权限体系、任务调度、日志审计、模型调用成本监控。

算力可以租。模型可以换。数据和流程才是自己的地盘。

资管机构对人工智能的认知，还要经历三个阶段。

第一阶段，熟悉人工智能。业务人员先在低风险场景里用起来，比如摘要、翻译、会议纪要、研报初筛。目的不是立刻创造超额收益，而是建立手感。只有大量真实使用，业务才会知道模型哪里强、哪里弱、哪里不能信。

第二阶段，了解人工智能。业务人员开始知道大模型不是投资之神，而是语言引擎。它擅长处理非结构化文本，不擅长承担最终金融判断。它可以生成候选，但不能替代校验。它可以辅助推理，但不能绕过数据血缘。

第三阶段，掌握人工智能。业务人员能把自己的投研流程拆成节点，和技术一起编排成智能体工作流。人工智能不再是外部工具，而成为内部生产系统的一部分。

这才是新质生产力的真实含义。

资管行业的新质生产力，不是人人都有一个投研聊天机器人。真正的新质生产力，是机构把自己的投研经验、风控规则、数据资产、业务流程固化成可运行、可复用、可审计的智能系统。

人工智能不一定替代某个岗位。但它会改变研究员、风控人员、运营人员、顾问和技术人员的协作方式。

它让人从重复处理、低价值核对和信息搬运中释放出来，把时间用在判断、定价、交易和责任承担上。

人工智能的破局，不是模型能力单点突破，而是组织能力、工程能力、数据能力和业务能力的共同进化。

最终赢家不是最早喊出通用人工智能的机构，而是最早把人工智能变成业务基础设施的机构。

结语

大模型的下半场，是苦活、累活、脏活。

真正有价值的不是会写漂亮答案的人工智能，而是能稳定执行成本能够长期承受的系统。

它应该被降维。降维成高级计算器。降维成文本解析器。降维成候选生成器。降维成工作流里的一个可控节点。

OpenClaw 类产品框架的价值，也不在于讲一个更大的智能体故事，而在于提供一条连接大模型与金融业务的重型履带。

参考资料与来源清单：

OpenRouter, State of AI 2025: An Empirical 100 Trillion Token Study with OpenRouter

https://openrouter.ai/state-of-ai论文版： https://arxiv.org/abs/2601.10088
Hugging Face, State of Open Source on Hugging Face: Spring 2026

https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026
DeepSeek API Docs, 模型 & 价格

https://api-docs.deepseek.com/quick_start/pricing
Anthropic Claude API Docs, Pricing

https://platform.claude.com/docs/en/about-claude/pricing
EY, GenAI in Wealth & Asset Management Survey 2025

https://www.ey.com/en_us/insights/wealth-asset-management/gen-ai-in-wealth-asset-management-survey
Mercer, AI in Investment Management Survey 2024

https://www.mercer.com/insights/investments/portfolio-strategies/ai-in-investment-management-survey/
Bloomberg Professional Services, AI at Bloomberg / AI News Summaries

https://professional.bloomberg.com/products/bloomberg-terminal/ai/
FactSet, Transcript Assistant

https://investor.factset.com/news-releases/news-release-details/factset-releases-transcript-assistant-game-changing-ai-tool
FactSet, Portfolio Commentary

https://investor.factset.com/news-releases/news-release-details/factset-introduces-ai-powered-portfolio-commentary
Morningstar, Direct AI Solutions / Mo

https://www.morningstar.com/business/products/direct-ai-solutions
BlackRock, Aladdin Copilot

https://www.blackrock.com/aladdin/solutions/aladdin-copilot
Morgan Stanley, AI @ Morgan Stanley Debrief

https://www.morganstanley.com/press-releases/ai-at-morgan-stanley-debrief-launch
OpenAI, Morgan Stanley case study

https://openai.com/index/morgan-stanley/
LSEG and Microsoft, AI-ready financial data in customer workflows

https://www.lseg.com/en/media-centre/press-releases/2025/lseg-and-microsoft-transform-access-to-ai-ready-financial-data-in-customer-workflows
Mercer, Moving Beyond the AI Pitch: Asset Managers’ use of AI

https://www.mercer.com/insights/investments/market-outlook-and-trends/asset-managers-use-of-ai/