当AI开始＂读盘＂:量化投资的下一个战场不在预测,而在＂提问＂

导语：如果AI能帮你做的不是”猜涨跌”，而是”问对问题”，你愿意把方向盘交给它吗？

一、一个被忽略的事实：量化圈正在经历”模型通胀”

2023年，某头部量化私募的招聘启事在业内刷屏。

不是招CTO，不是招算法工程师，而是招“另类数据研究员”——要求懂产业链、懂财报勾稽关系、甚至懂怎么从卫星图里数停车场车辆。

这释放了一个信号：当所有人都在卷模型复杂度时，真正稀缺的资源正在悄然转移。

过去五年，量化投资的军备竞赛经历了三个阶段：

阶段	核心武器	竞争结果
2018-2020	线性模型+基本面因子	同质化严重，超额收益衰减
2020-2022	深度学习+LSTM/Transformer	算力门槛提高，但并未拉开代差
2023至今	大模型+另类数据	因子质量成为分水岭

一个残酷的真相是：当你还在调参优化神经网络结构时，对手可能已经用AI挖出了你从未想过的因子维度。

这不是危言耸听。2024年Q2，某百亿量化管理人的路演中透露，其AI因子挖掘系统月均产出有效因子数量是人工团队的7倍，而研发成本仅为后者的1/5。

二、为什么”因子发现”比”因子组合”更难被AI替代？

要理解这个问题，得先区分两个概念：判别式AI与生成式AI。

传统量化模型（XGBoost、神经网络等）本质上是判别式的——它们擅长回答：”给定这些因子，明天涨还是跌？”

而大语言模型是生成式的——它们擅长回答：”如果市场处于高波动状态，哪些微观结构指标可能预示着反转？”

前者是”做题”，后者是”出题”。

在量化投资中，”做题”的技术已经高度成熟。你可以用AutoML自动调参，用集成学习自动组合，甚至用强化学习自动优化仓位。

但”出题”——即提出一个逻辑自洽、可解释、可回测的新因子——仍然高度依赖人的洞察力。

举个例子：

人工挖因子的典型路径：观察到”抱团股瓦解时，小市值因子往往失效” → 思考”是否可以用筹码分散度来预警？” → 设计”前十大股东持股比例变化率”因子 → 回测验证 → 优化参数。

这个过程中，“观察到现象→抽象出逻辑→转化为数学表达式”的链条，恰恰是AI最难替代的部分。

但注意，我说的是”最难替代”，不是”不能辅助”。

三、AI因子挖掘的实战范式：从”炼丹”到”人机协同”

目前业内探索出的可行路径，不是让AI凭空创造因子，而是构建“人机协同的因子实验室”。

范式一：逻辑延展法

操作方式：给AI一个已验证的市场逻辑，让它生成多维变体。

案例：已知逻辑：”动量因子在牛市有效，熊市失效”。

输入AI后，它可能生成以下延展：

变体A：区分”基本面动量”与”价格动量”，仅在盈利预期上调时启用

变体B：引入波动率调节系数，高波动期降低动量权重

变体C：结合资金流向，仅保留”聪明钱”推动的动量

人的角色：判断哪些变体符合市场机理，筛选可回测的候选集。

范式二：失效诊断法

操作方式：将因子的回撤时段输入AI，让其诊断”病因”并开方。

案例：某价值因子在2021年2月-7月连续回撤。

AI分析后提出假设：

“该时段核心资产估值泡沫化，传统PB/PE指标失效。建议加入’分析师预期修正速度’作为过滤器，仅在预期稳定时启用价值因子。”

回测显示，加入该过滤器后，因子最大回撤从18%降至9%，夏普比率提升0.4。

范式三：跨域迁移法

操作方式：让AI将其他领域的成熟逻辑迁移至量化场景。

案例：从生态学”种群竞争模型”中获得灵感，AI生成”行业龙头市占率变化率”因子——当老二与老大的营收增速差收窄时，预示行业竞争格局恶化，规避该板块。

这类因子的独特价值在于：它来自非金融领域的隐喻，人工团队几乎不可能独立想到。

四、警惕”伪因子陷阱”：为什么AI需要”刹车片”？

2022年，某量化团队曾用遗传规划自动生成因子，三个月内产出上万个表达式，回测胜率极高。

但实盘三个月后，策略净值回撤23%。

事后复盘发现：80%的”有效因子”是过拟合产物——它们恰好拟合了历史数据中的随机噪声，而非真实的市场规律。

这正是纯AI挖因子的最大风险：数学上的优美，不等于经济逻辑上的成立。

因此，当前最务实的做法不是”AI全自动挖因子”，而是建立“AI生成+人工审核+快速回测”的三道闸门：

逻辑闸：AI生成的因子必须有可叙述的经济逻辑（不能只是”X的平方根乘以Y的对数”）

稳健性闸：通过样本外测试、参数敏感性分析、不同市场周期验证

可交易闸：考虑换手率、冲击成本、容量限制，排除”纸面富贵”型因子

记住：AI是放大镜，不是滤镜。它能放大你的认知边界，但不能过滤掉你的认知盲区。

五、未来三年，量化研究员的核心竞争力是什么？

如果AI能一分钟生成50个因子候选，那么量化研究员的价值在哪里？

我认为答案藏在三个关键词里：提问力、判断力、连接力。

1. 提问力：从”帮我找个好因子”到”在何种市场状态下，哪些微观结构会预示反转？”

AI的输出质量，高度依赖输入问题的质量。同一个AI，面对模糊提示和精准提示，产出可能天差地别。

未来优秀的量化研究员，首先是“会提问的人”。

2. 判断力：在50个候选中，识别出哪3个值得深入

AI可以消除”想不到”的遗憾，但无法替代”选得对”的直觉。

这种直觉来自对市场微观结构的长期观察，来自对无数次回测失效的复盘，来自对人性贪婪与恐惧的深刻理解。

3. 连接力：将另类数据、跨学科逻辑与金融场景嫁接

当AI降低了”生成”的门槛，“连接不同领域知识”的能力反而更加稀缺。

懂气象数据与电力期货的关联、懂半导体周期与库存指标的映射、懂社交媒体情绪与散户行为的共振——这些跨界连接能力，将成为量化研究员的护城河。

结语：铲子与金矿

每一次技术革命，人们总高估”替代”的速度，低估”赋能”的深度。

AI不会在一夜之间让量化投资变成”自动印钞机”。但它正在重塑行业的分工逻辑：

重复性整合→ 交给模型

创造性发现→ 人机协同

战略性判断→ 回归人类

在这场变革中，AI更像一把高效的铲子——它不能替你决定挖哪里，但能让你挖得更快、更深、更省力。

而最终决定你能不能挖到金矿的，仍然是你提问的方向、判断的准度、以及连接不同世界的能力。

毕竟，在因子挖掘这场无限游戏里，最大的金矿从来不是某个具体因子，而是持续发现因子的能力本身。

（本文仅供学术交流，不构成投资建议。市场有风险，投资需谨慎。）