AI量化时代,别被工具架空:Quant真正的护城河在哪里?

过去几年，量化研究的工作方式正在发生一次深层变化。

以前，一个研究员想验证一个想法，需要自己找数据、清洗字段、写回测、调参数、做归因、写报告。一个因子从灵感到结论，可能要经历数天甚至数周。很多时候，真正耗费精力的不是判断，而是执行。

现在不同了。

AI 可以读论文，可以写代码，可以跑回测，可以解释图表，可以批量生成因子假设。过去需要一个小组几周完成的工作，现在一个人配合 Agent，可能几天就能搭出原型。工具链变得越来越完整：LLM 负责提出假设，代码 Agent 负责实现，回测框架负责验证，多 Agent 辩论负责挑错，报告生成器负责总结。

这看起来像一次生产力解放。

但很多人很快发现，研究速度确实上去了，真正能沉淀下来的有效结论却没有同步增加。因子越来越多，报告越来越长，讨论越来越像那么回事，可实盘收益并没有变得更容易。甚至，某些团队在工具更强之后，反而更容易陷入重复、过拟合和伪信号。

这背后有一个不太舒服的事实：

当“挖掘”变得廉价，真正稀缺的就不再是生成能力，而是判断能力。

AI 量化时代，Quant 的核心价值正在迁移。从“谁能更快找到一个因子”，变成“谁能判断这个因子是否值得相信”；从“谁能写出更复杂的模型”，变成“谁知道模型什么时候不该被相信”；从“谁拥有更多工具”，变成“谁能不被工具架空”。

这篇文章想讨论的，就是这个迁移。

本文改编自公众号“随机森林之外”最近的数十篇文章，欢迎关注公众号“随机森林之外”、该号主知乎https://www.zhihu.com/people/zheng-jiansen/posts 、该号主知识星球-非随机Alpha。

一、技术平权之后，差距没有消失，只是换了位置

每一次重大技术普及，都会让某种原本稀缺的能力变得便宜。

蒸汽机普及后，动力不再是壁垒，价值流向了设计铁路网络和组织生产的人。电力普及后，能源不再是壁垒，价值流向了流水线、工厂组织和管理体系。互联网普及后，信息获取不再是壁垒，价值流向了过滤信息、组织流量和建立信任的人。

AI 对量化交易的影响，也是类似逻辑。

过去，很多人的优势来自“会做”。会爬数据，会写回测，会调模型，会搭框架，会自动化跑实验。这些能力当然仍然重要，但它们正在被工具快速平权。一个刚入行的人，只要会提问、会调用工具，也能很快写出像样的回测系统。

这并不意味着 Quant 不值钱了，而是“值钱的部分”变了。

以前的稀缺性在执行链条上：想法到代码、代码到回测、回测到报告。现在这条链条正在自动化。于是价值自然向上游迁移：为什么要研究这个方向？这个假设的因果基础是什么？它是否只是历史噪声？它在什么市场环境下失效？当模型输出和交易直觉冲突时，应该信谁？

这些问题，AI 可以参与讨论，但很难替我们最终负责。

AI 能生成一万个因子，但它不能天然知道哪一个因子明天还有效。AI 能把一段行情解释得非常完整，但它不知道这个解释是否只是事后叙事。AI 能在历史数据中找到显著模式，但它不会自动区分“可交易的结构”和“噪声对海量搜索的馈赠”。

工具越强，越容易制造一种错觉：只要把工具堆够，答案就会自己浮现。

但市场从来不是一道只要算力足够就能解出的题。市场是一个会反应、会学习、会反身性变化的系统。你发现规律并开始交易规律的那一刻，规律本身就已经开始被改变。

因此，AI 时代的 Quant，不是被迫和机器比谁更会写代码，而是要回答一个更难的问题：当机器让“尝试”变得几乎免费，我们如何避免被无数看似有效的尝试淹没？

二、Agent 挖因子越快，伪信号也越多

近两年，LLM Agent 驱动因子挖掘成为热门方向。不同框架的叙事各有侧重：

有的强调从市场逻辑出发生成因子，让因子更可解释；有的强调正则化探索，避免生成与已有因子过于相似的表达式；有的让多个 Agent 互相辩论，在生成阶段就检测过拟合风险；还有的尝试构建更全面的因子评估体系，不再只看 IC 或回测收益。

这些方向都很有价值。但它们共同面对一个核心困境：

Agent 生成因子的本质，是规模化搜索。

规模化搜索一定会放大数据窥探偏差。

Lo 和 MacKinlay 很早就指出，如果我们对同一组历史数据反复测试大量策略，即使所有策略本质上都是噪声，也会出现一些看起来显著的结果。传统人工研究时代，一个研究员一年手动尝试几千个表达式，已经足以产生数据窥探问题。现在 Agent 可以在短时间内生成上万个候选，问题只会更严重。

更麻烦的是，LLM 生成的因子往往自带“解释”。一个过拟合表达式，如果只是数学公式，研究员可能还会警惕。但如果它被包装成“流动性压力”“风险偏好修复”“资金拥挤释放”之类的叙事，就更容易被接受。

这就是因果自欺。

人类本来就擅长给随机结果编故事。AI 的加入，让故事生成得更快、更完整、更像真的。

所以，真正危险的不是 Agent 找不到因子，而是它找到太多因子，而且每个都能说得通。

在这种环境下，因子研究的护城河不再是生成，而是筛选。我们需要一套不容易骗自己的流程：

第一，要有搜索边界。因子的生成空间不能无限膨胀。操作符、复杂度、变量组合、经济逻辑都需要约束。自由度越高，样本内越容易好看，样本外越容易崩。

第二，要有对抗性测试。随机标签置换、子样本剔除、噪声注入、市场状态切分，这些测试的目标不是证明因子有效，而是尽早发现它是不是在骗我们。

第三，要有样本外纪律。真正有效的因子，不能只在一个市场状态、一个时间窗口、一个参数设定下成立。它可以有适用边界，但边界必须被明确写出来。

第四，要有因果反证。每个因子都应该回答一个问题：如果我的因果解释是错的，哪些现象会出现？如果这些现象已经出现，我是否愿意放弃这个因子？

很多研究失败，不是因为没有找到好看的因子，而是因为没有勇气及时否定好看的因子。

AI 会让“好看的因子”越来越多。未来真正稀缺的，是能果断丢掉它们的人。

三、上下文不是越多越好，记忆系统必须会遗忘

AI Agent 在投研中还有一个常见误区：既然模型需要上下文，那是不是应该把所有历史研究、论文、实验日志、聊天记录都塞进记忆库？

直觉上，这似乎合理。

没有上下文的 Agent 确实会重复犯错。它可能不知道上周哪个假设已经被证伪，不知道某个因子在某个市场状态下失效，不知道当前组合的风险约束。于是，每次研究都像从零开始。

但另一个极端也同样危险：上下文太多，模型会被旧信息拖住。

LLM 的注意力机制不会天然判断“这条结论已经过时”。旧报告、旧回测、旧市场环境下的成功经验，如果没有被降权或归档，就会以近似同等权重参与新的推理。于是，模型可能把不该放在一起的信息拼接成一个看似自洽、实则因果断裂的结论。

这就是上下文腐烂。

投研工作的核心不是存储信息，而是筛选信息。记忆系统不是仓库，而是筛子。

一个长期运行的投研 Agent，如果只会记住，不会遗忘，最后会陷入路径依赖。过去成功的方向在记忆库里出现次数多、共现关系强，更容易被检索出来。模型就会不断强化旧方向，生成的新假设越来越像过去的成功案例。

这在市场状态稳定时可能看起来不错，但一旦环境切换，系统就会越来越迟钝。

因此，研究记忆要设计三件事：

第一，压缩。保留有效市场环境、参数敏感性、失效原因、样本外表现，而不是保留所有原始日志。压缩的目的不是省 token，而是提高信息密度。

第二，遗忘。每条研究结论都应该有有效期。因子、假设、市场状态判断，都需要 TTL。到期后如果没有新的验证，就自动降权或归档。严格证伪的结论要默认排除，而不是继续作为“参考材料”污染上下文。

第三，状态标注。任何研究结论都应该标注适用市场状态。趋势市有效的因子，不应在震荡市中以同等权重参与推理；高波动时期得到的结论，也不能无条件迁移到低波动环境。

一个好的投研 Agent，不是记得最多，而是知道什么该忘。

市场本身是非平稳的。如果记忆系统不能随市场状态变化而调整，它保存的不是知识，而是旧世界的偏见。

四、回测越逼真，越容易制造确定性的幻觉

AI 让回测变得更容易，也让回测变得更危险。

过去，回测是一种验证工具。我们知道它有限，知道它依赖历史，知道它只是参考。现在，AI 可以帮我们快速构建跨资产、跨周期、带交易成本、带风控规则、带报告解释的完整回测系统。回测图表越来越专业，归因越来越细，压力测试越来越丰富。

问题是，当一个回测看起来足够完整，它就容易从“参考”变成“信仰”。

这是一种确定性的幻觉。

回测再长，也只覆盖已经发生的一条历史路径。金融市场并不保证遍历性。所谓遍历性，是指一条足够长的历史路径可以代表所有可能状态。但市场中的参与者、规则、工具、监管、流动性结构都在变化。未来并不一定从过去那个“瓮”里抽样。

当市场切换到一个旧数据从未覆盖的新生成过程时，回测里的概率不再是“小概率”，而是根本不在样本空间里。

古典贝叶斯更新在这种情况下不会自动报警。它仍然会在既定模型空间内更新参数，给出后验，收敛到一个“最接近真实分布的错误参数”。模型看起来仍然理性，指标也可能仍然正常，但它已经在错误世界里自洽。

这就是很多策略最危险的状态：正常地犯错。

净值已经开始走坏，但预测误差还在历史范围内；因子 IC 没有明显异常，但市场不再奖励它；协方差矩阵继续收缩到长期均值，但长期均值已经不适用；HMM 仍然把市场分到某个旧状态里，但真实市场可能已经出现了新状态。

因此，成熟的量化系统必须监控模型的边界，而不只是监控模型的误差。

可以做几件事：

一是状态归属熵。对于状态分类模型，如果当前数据对所有已有状态的归属概率都变得模糊，说明现有分类体系的解释力在下降。

二是鲁棒折扣。把“对模型不确定”的程度写进仓位方程。当预测误差波动上升、状态归属熵上升、模型分歧扩大时，自动折扣 alpha，而不是等净值回撤后再主观减仓。

三是开放状态空间。固定状态数的模型会强行把新市场塞进旧类别。更开放的思路是允许新状态被数据触发，哪怕工程上先用简单的异常检测近似，也比强行归类更诚实。

回测的意义，不是证明策略永远有效，而是帮助我们理解策略在哪些条件下会失效。

如果一个回测报告只告诉我们赚了多少钱，却没有告诉我们什么时候不该相信它，那它是不完整的。

五、执行成本不是噪声，而是博弈的结果

很多量化研究把交易成本当作模型之外的摩擦项。回测里加几个基点滑点，做做敏感性分析，好像就算处理过了。

但在真实市场里，执行成本不是静态摩擦，而是博弈结果。

大额交易者拆单，本意是把自己隐藏在背景噪声里。但 TWAP、VWAP 这类算法天然带有时间自相关。固定时间间隔、固定成交量比例、平稳进度控制，都让订单流出现规律性。

规律性就是信号。

HFT 不需要知道我们的真实意图。它只要观察过去几笔子单的到达时间、规模和方向，就能估计下一笔可能什么时候来。只要订单流足够稳定，简单的线性滤波器就能提取预测信息。

于是，大额交易者成了 Stackelberg 博弈中的先动者。我们先承诺了一个执行计划，HFT 后观察、后反应。常识里先动者有优势，但在市场微观结构中，先动意味着暴露。HFT 作为追随者，可以根据我们的痕迹决定做市、抢跑、跟随或撤退。

这解释了为什么某些执行成本残差不是随机的。

如果在子单到达前的零点几秒，最优报价附近反复出现新的挂单，又迅速消失；如果成交价长期相对 VWAP 正偏；如果越慢执行，成本越高；那就不能只归咎于滑点模型不准。我们的订单流可能正在被阅读。

解决思路不是简单“更快”。

执行太慢，给了 HFT 更多时间识别模式；执行太快，会带来瞬时市场冲击。最优执行是在两条成本曲线之间找平衡。

更重要的是降低订单流的可预测性：

时间抖动。平均节奏不变，但具体间隔随机化。

规模伪装。不要机械地按固定成交量比例切单，而是在合理范围内引入非线性映射。

进度随机化。在不破坏完成约束的前提下，让订单流更接近白噪声。

暴露诊断。把子单按 5 秒或 10 秒窗口聚合，计算 ACF(1)、线性预测误差、打乱序列后的对照误差。如果原始序列明显更容易预测，就说明订单流有可读结构。

执行不是研究的尾声，而是策略的一部分。

一个样本内有效的 alpha，如果执行痕迹过于清晰，最终收益会被市场以滑点形式征收掉。

六、参数悬崖：最优参数有时是陷阱

回测里，最优参数总让人安心。

20 日突破比 15 日好，ATR 止损 2.5 倍比 2 倍好，持仓周期 30 天比 20 天好。我们扫描参数空间，找到夏普最高点，然后把它当作策略核心。

但现实中，最优点往往也是拥挤点。

因为全行业使用相似的数据、相似的回测框架、相似的交易成本假设、相似的评价指标。独立优化的结果，可能自然聚集在同一片参数区域。这不是阴谋，而是参数空间地形决定的。

如果大量策略使用相近参数，它们会在相似价位止损、在相似突破点入场、在相似回撤幅度减仓。于是，某些价格带就会堆积大量潜在订单。

当价格触及这些区域，止损单同时转成市价单，盘口深度被瞬间吃穿，价格跳到下一个有流动性的档位。我们看到的就是滑点突然放大、成交价远差于预期、随后价格又反弹。

这就是参数悬崖。

它不是普通过拟合，也不完全是主动止损猎杀。它更像是许多独立策略因为共享评价体系而站上了同一块松动的岩石。

应对参数悬崖，关键不是找到更精确的最优参数，而是选择更鲁棒的参数区间。

参数邻域稳定性测试很重要。找到最优参数后，在正负 10% 或 20% 范围内扰动，观察策略表现。如果夏普在邻域内迅速坍塌，说明这个点可能是孤峰。孤峰在回测里好看，在实盘中脆弱。

相比之下，一个略低于最高夏普、但周围表现平缓的参数区间，可能更有容量，也更不容易被市场针对。

还可以引入参数随机化。不要固定在一个点，而是在鲁棒区间内随机或轮换使用参数。这样牺牲一点样本内最优性，换取样本外抗拥挤能力。

真正成熟的策略，不应该痴迷于回测曲线上的最高峰。

最高峰往往是人最多的地方。

七、CTA 的困境：市场没有变，但记忆长度变了

CTA 策略失效时，最常见的解释是过拟合、滑点、拥挤、行情不配合。这些解释都对，但还不够底层。

很多时候，真正的问题是尺度漂移。

趋势不是价格序列自带的绝对属性。5 分钟看可能是上涨，1 小时看是震荡，日线看是下跌。哪个是真的？都是真的，只是观测尺度不同。

策略赚钱，不只取决于市场有没有趋势，还取决于策略选择的时间尺度是否匹配当前市场的特征时间。

如果过去一个趋势平均持续 60 天，而现在只持续 15 天，原来的 60 日趋势模型就会反应过慢。如果过去市场噪声周期较短，现在噪声周期拉长，短周期策略就会反复被假信号消耗。

这就是尺度漂移：市场的记忆长度变了。

时序 CTA 的核心困境，是它没有天然对冲腿。无论叠加多少因子，最终仍然是在单一资产上输出净方向。它可以通过仓位管理降低风险，但无法像截面多空那样天然剥离市场方向。

截面 CTA 解决了部分方向风险，却引入了另一类问题：截面拥挤、多空双杀、尾部偏度变化、交易成本累积。截面动量在平稳分化市场中表现好，但在系统性冲击、相关性趋近 1 时，多空对冲会暂时失效。

所以，时序和截面不是谁替代谁，而是两种不同代价。

时序策略要求我们接受收益不均匀、等待大趋势、承受震荡磨损。截面策略要求我们接受品种池有限、逻辑异质性、交易成本和拥挤崩溃。

更务实的做法是构建诊断体系：

滚动估计特征时间。用收益率自相关半衰期、AR(1) 系数、Hurst 指数等指标监控市场记忆长度是否漂移。

多时间尺度集成。不要押注单一窗口，同时运行短、中、长周期子策略，用慢速权重更新或等权组合降低尺度错配。

拥挤度监控。观察持仓相关性、品种间相关性、持仓量变化、换手率异常。当拥挤度上升时，主动降低杠杆。

状态软切换。不要硬切参数。用状态概率对多套参数加权，避免模型在状态边界反复跳变。

CTA 的长期生存，不是找到一个永恒参数，而是对尺度漂移保持敏感。

市场不会告诉我们当前哪个尺度管用。它只会在我们选错尺度后，慢慢收取代价。

八、波动率模型的启示：线性不一定低级，复杂不一定稳健

在机器学习盛行的年代，HAR 波动率模型显得很朴素。

它用昨日、上周、上月的已实现波动率，线性回归预测未来波动率。没有神经网络，没有复杂非线性，也没有漂亮的黑箱结构。

但它长期作为波动率预测的基准模型存活下来。

这件事很值得量化研究员反思。

HAR 的强大，不在于模型复杂，而在于它抓住了波动率的多尺度记忆结构。昨日波动反映短期冲击，上周波动反映中期持续性，上月波动反映慢变量。三个尺度叠加，足以刻画很多资产波动率的核心节律。

更重要的是，HAR 使用已实现波动率作为输入，而不是日收益率平方。后者噪声极大，前者通过高频收益累加，更接近积分方差。输入变量质量高，模型可以简单。

这给 AI 量化一个启示：

复杂模型不是目的，高质量表征才是目的。

很多时候，复杂模型在样本内赢了 HAR，但样本外并没有稳定优势。因为它捕捉了更多短期模式，也捕捉了更多噪声。一旦市场结构变化，复杂模型的预测误差可能爆发式上升，而 HAR 因为只抓慢变量，反而更稳。

这不是说不要用复杂模型，而是要知道它们适合做什么。

复杂模型适合在特征空间丰富、样本量足够、市场结构相对稳定的场景中挖掘非线性关系。简单模型适合做慢速基线、风险预算、风控锚点。

一个实用框架是：

把 HAR 作为正常波动水平的慢速基线；

用日内实现波动率或更快指标做实时调整；

监控 HAR 残差，当实际波动显著高于预测时，认为市场进入线性记忆无法解释的状态，自动降仓或切换风控规则；

定期重估 HAR 系数，观察日、周、月系数的变化，作为市场微观结构状态的代理。

模型的价值，不只在预测精度，也在稳定性、可解释性和失效时的可诊断性。

有时候，一个知道自己做不到什么的模型，比一个什么都想拟合的模型更可靠。

九、概率校准为什么总是漂移

很多策略上线前，概率模型校准得很好。预测 0.7 的样本，真实胜率接近 70%；预测 0.6 的样本，真实胜率接近 60%。校准曲线漂亮，仓位分配合理。

上线几个月后，概率开始漂移。

0.7 的胜率变成 0.5，0.6 的胜率反而可能更高。重新校准一段时间有效，过一阵又坏。

这不是简单技术问题，而是金融市场中的概率本身不稳定。

概率漂移有三种机制：

第一，市场状态漂移。同样的特征组合，在低波动市场和高波动市场中对应的胜率不同。

第二，概率坍缩。如果很多人使用同一信号，高概率样本会被提前交易掉，未来收益被透支。

第三，仓位反馈。当资金规模足够大，交易本身会改变流动性和价格路径，模型预测对象被我们自己的行为改变。

所以，金融里的概率不是抛硬币那种稳定常数，而是市场状态和参与行为共同塑造的条件映射。

这并不意味着模型没用。概率数值容易漂移，但排序能力往往更稳。

模型说 A 比 B 更值得买，这个相对排序，可能比“上涨概率是 0.73”更可靠。

因此，实盘系统应该同时维护两条线：

概率线：用于仓位强弱，但必须收缩、折扣、监控校准误差；

排序线：用于相对选择，通过 AUC、分档胜率单调性等指标监控。

如果概率漂移但排序仍然有效，可以降级为分档仓位。比如前 20% 给高权重，中间不给仓位，后 20% 做空或低权重。

如果排序也失效，AUC 跌破阈值，分档胜率不再单调，那就必须暂停模型。

成熟系统不是永远校准正确，而是在校准失效时知道如何降级。

十、LPPL 的价值不是预测崩盘，而是提醒我们脆弱

LPPL 模型常被用来识别泡沫和临界点。它能拟合加速上涨中的对数周期震荡，并给出一个临界时间。

问题是，它太灵活了。

七个参数让它几乎可以拟合很多随机价格形态。即便样本内拟合优度很高，也不代表临界点真实存在。滚动拟合时，临界时间往往大幅漂移。今天是 30 天后，明天是 60 天后，后天又变成 15 天后。

如果基于某个具体日期调仓，本质上是在用噪声做决策。

但这不意味着 LPPL 毫无价值。

它的正确用法，不是预测“哪天崩盘”，而是作为脆弱性指标。

当价格进入加速上涨、回调变浅、振荡频率变化、波动率和持仓量异常时，LPPL 可以作为多信号体系的一部分，提醒我们：线性趋势策略在这里可能很脆弱。

更稳健的做法是：

放弃单一点估计，采用多初值拟合或贝叶斯方法输出临界时间分布；

观察临界时间区间是否连续收敛，而不是看某一天的结果；

对残差检验做自举校正，不盲信标准显著性；

结合持仓量异常、隐含波动率 skew、ADX 过热、成交结构变化等信号，形成综合脆弱性指标；

触发警报时降低风险预算，而不是直接反手交易。

LPPL 像一面镜子。它照出的不是未来日期，而是我们策略在非线性行情中的脆弱性。

很多模型的价值都应该这样理解：不要问它能不能预测世界，而要问它能不能告诉我们自己什么时候不该太自信。

十一、杠铃结构：相关性会骗人，凸性不会

组合管理中，很多人依赖相关性矩阵做分散化。

平时看起来低相关的策略，在危机中可能一起亏。统计套利、市场中性、做空波动率、杠杆均值回归，平时收益来源不同，相关性很低。但在流动性枯竭、波动率飙升、强制平仓时，它们可能暴露出同一种结构缺陷：负凸性。

所谓负凸性，就是小波动时赚得稳定，极端行情中亏损加速。

相关性描述的是线性联动，凸性描述的是非线性冲击下的生存结构。

很多组合的问题不在于策略不够多，而在于它们都隐含做空尾部风险。平时分散，危机中同向。

杠铃结构的意义，在于主动承认中间地带的危险。

一端是安全资产或低风险策略，提供流动性和生存能力；另一端是正凸性资产或策略，比如趋势跟踪、危机 alpha、尾部保护。中间那些高夏普但尾部不透明的策略，反而要谨慎。

这不是保守，而是结构韧性。

判断一个组合是否健康，不只看夏普和最大回撤，还要做压力测试：

2008 年、2015 年、2020 年、2024 年类似流动性冲击环境中，组合曲线是加速下跌，还是能产生对冲收益？

单边趋势市中，正凸性端是否能上涨？

震荡市中，安全端是否能覆盖凸性端磨损？

当波动率和相关性同时上升时，组合是否还有一部分资产受益？

如果一个组合在所有平稳环境里都好看，但在极端压力中一起失血，它不是分散化，只是包装过的同质化。

相关性矩阵可以被粉饰，凸性不会。

十二、高低频融合：不要叠加，要门控

高频因子和中低频因子常常互相打架。

高频反转在震荡环境中赚钱，在单边趋势中不断止损。中低频趋势在趋势环境中赚钱，在噪音环境中磨损。如果简单等权叠加，噪音期趋势拖后腿，趋势期高频反转拖后腿。

这不是分散，而是互相抵消。

更合理的方式是门控。

高频数据的最大价值，不一定是直接预测方向，而是识别当前市场环境。它能告诉我们：现在是噪音交易主导，还是知情交易者主导？订单流是随机反转，还是持续单边？日内波动更多来自来回摆动，还是方向性推进？

因此，可以把系统分为三层：

感知层：用高频数据计算环境指标，比如订单流持续性、日内噪音强度、短期收益自相关、盘口不平衡等；

决策层：用中低频因子决定方向，比如趋势、基差、库存、宏观逻辑；

执行层：用高频信号优化下单时机，降低冲击成本。

在噪音主导环境中，降低趋势因子仓位，允许高频反转或限价执行发挥作用。

在趋势主导环境中，恢复趋势因子仓位，关闭逆势高频反转。

在混合状态中，降低总风险，因为市场可能处于切换区间。

这就是从“静态叠加”到“动态门控”的转变。

高频信号不是一定要自己赚钱，它可以保护中低频策略不在错误环境里重仓。

很多因子没有失效，只是被放错了环境。

十三、AI 工具越多，越需要做减法

工具多，本身不是问题。

问题是，当工具变成判断的替代品，研究员就会被工具架空。

我们引入一个新模型，一个新 Agent，一个新数据源，一个新评估器，看起来每一步都提高了能力。但多个工具耦合后，可能产生新的复杂性：信号互相抵消，风险重复暴露，模型互相确认错误，执行层放大拥挤。

每一个单独工具都“有效”，合在一起却失效，这是量化系统里很常见的现象。

因为工具链越复杂，认知成本越高。研究员越难知道最终仓位到底来自哪个假设，最终亏损到底源于哪个环节。复杂系统一旦不可解释，风控就会变成事后复盘，而不是事前约束。

所以，引入 AI 工具前，需要问一个问题：

它是在帮助判断，还是替代判断？

帮助判断的工具，输出更清晰的数据、更完整的场景、更高效的验证。它的终点是人的判断。

替代判断的工具，输出可直接执行的指令。它的终点是人的执行。

两者边界，就是交易者主体性的边界。

未来不缺会调用 Agent 的人。缺的是知道什么时候不该听 Agent 的人。

AI 可以是磨刀石，但不能变成握刀的手。

十四、Quant 的新护城河：筛选、否定、承担后果

AI 量化时代，Quant 不会消失，但工作重心会改变。

低层执行会越来越自动化。写代码、跑回测、生成报告、批量测试因子，这些事情的门槛会持续下降。

真正稀缺的能力，会集中在四个方面。

第一，提出有价值问题的能力。

不是“再找一个因子”，而是判断当前市场最值得研究的结构矛盾是什么。是执行成本异常？是波动率中枢切换？是某类策略拥挤？是订单流被读取？是概率校准失效？问题定义错了，工具越强越容易跑偏。

第二，筛选伪信号的能力。

未来不是缺因子，而是伪信号过剩。谁能建立更严的筛选流程，谁就能少被噪声骗。

第三，理解策略失效边界的能力。

一个策略什么时候赚钱不难描述，难的是它什么时候会亏，为什么会亏，亏的时候是否还能坚持，还是应该降级或退出。

第四，承担后果的能力。

交易最终不是报告，而是仓位。模型可以建议，AI 可以解释，但盈亏由人承担。真正的判断，必须包含承担后果的勇气。

很多人担心 AI 抢走 Quant 的工作。

更现实的风险是：AI 没有抢走我们的工作，却抢走了我们的判断。

当模型输出越来越完整、解释越来越漂亮、回测越来越逼真，我们可能不再主动思考，只是在确认模型已经告诉我们的结论。久而久之，研究员从决策者退化成执行层。

这才是最危险的。

结语：市场奖励的不是工具，而是边界感

庖丁解牛，用刀十九年而若新发于硎。原因不是刀锋无限锋利，而是他知道骨肉之间的缝隙在哪里。

AI 模型之于市场，也像刀。

再好的模型，也只能在市场真实存在的缝隙里发挥作用：可重复的结构、稳定的微观机制、未被充分交易的认知差、尚未拥挤的执行空间。

当市场因反身性、结构切换、流动性断裂而改变时，缝隙的位置也会移动。没有模型能切开不存在的缝隙。

因此，AI 量化的关键不是拥有更多刀，而是知道哪里有缝隙，哪里是骨头，哪里应该停手。

未来的 Quant，不能只会追逐更复杂的工具。真正重要的是：

能否识别因子背后的因果结构；

能否发现回测里的确定性幻觉；

能否在模型开始正常犯错时及时降级；

能否在工具输出漂亮结论时仍然保持怀疑；

能否在市场没有答案时，承认不知道，并活下来。

技术平权清掉了很多低效劳动，也清掉了很多旧护城河。

但它没有清掉市场的不确定性，没有清掉反身性，没有清掉尾部风险，也没有清掉人必须承担判断后果这件事。

工具会越来越强，规律会越来越快被发现，也会越来越快失效。

最终能留下来的，不是最会使用工具的人，而是最清楚工具边界的人。

AI 时代的量化研究，或许应该从一句话重新开始：

不要问模型还能替我们做什么。

要问，当模型什么都能做时，我们还保留了什么不能外包的判断。

本文改编自公众号“随机森林之外”最近的数十篇文章，欢迎关注公众号“随机森林之外”、该号主知乎https://www.zhihu.com/people/zheng-jiansen/posts 。

很多做加密量化的朋友都有一个苦恼，没有历史数据源！自己录太麻烦！Tardis官方API太贵了！

💐今天给大家推荐一个便宜且稳定的Tardis数据源！100元就可以买到！

🫧Tardis API是solo1200刀年费！价值10万元!

📊有所有交易所的合约现货期权！全量全历史！（可联系v：15180066256购买数据）

🌈数据套餐与定价

🔴套餐一：一次性购买数据，告知需求数据，下载好后直接发货。

定价：根据数据量大小与储蓄成本定价，少量数据100g以内的数据100元。

热门数据100-200元1T。普通数据200-250元1T。

🔥套餐二：VIP租赁价值10万元的Tardis API!任意调用API下载！

云服务器里已存100T数据，无限制任意下载！

定价：VIP周费500元 VIP半月费900元

VIP月费1500元！

🌟套餐三：定制每日更新链接，若需求量为稳定数据，且需要每日更新。如每日更新币安合约BTC和ETH数据。

定价：定制链接一个月100元起。

⚡️专业定制：原始数据是tick级，需要1s 1m 1h等级别的我们都可以定制！

（可联系微：15180066256购买数据）

✨我们有什么数据？

市面上全部的交易所：Binance OKX Bybit Coinbase Gate.io Kucoin Hyperliquid Deribit等。

1.合约字段

derivative_ticker包含open interest与funding rates.

2.现货字段

3.各个交易所的期权期权链都包含。

💫我们的档位

☀️VIP月费套餐详细介绍

可联系微：15180066256 购买数据。

补充说明：数据仅用于学术研究，且经过二次加工。