乐于分享
好东西不私藏

当AI开始"读盘":量化投资的下一个战场不在预测,而在"提问"

当AI开始"读盘":量化投资的下一个战场不在预测,而在"提问"

导语:如果AI能帮你做的不是”猜涨跌”,而是”问对问题”,你愿意把方向盘交给它吗?

一、一个被忽略的事实:量化圈正在经历”模型通胀”

2023年,某头部量化私募的招聘启事在业内刷屏。
不是招CTO,不是招算法工程师,而是招“另类数据研究员”——要求懂产业链、懂财报勾稽关系、甚至懂怎么从卫星图里数停车场车辆。
这释放了一个信号:当所有人都在卷模型复杂度时,真正稀缺的资源正在悄然转移。
过去五年,量化投资的军备竞赛经历了三个阶段:
阶段
核心武器
竞争结果
2018-2020
线性模型+基本面因子
同质化严重,超额收益衰减
2020-2022
深度学习+LSTM/Transformer
算力门槛提高,但并未拉开代差
2023至今
大模型+另类数据
因子质量成为分水岭
一个残酷的真相是:当你还在调参优化神经网络结构时,对手可能已经用AI挖出了你从未想过的因子维度。
这不是危言耸听。2024年Q2,某百亿量化管理人的路演中透露,其AI因子挖掘系统月均产出有效因子数量是人工团队的7倍,而研发成本仅为后者的1/5

二、为什么”因子发现”比”因子组合”更难被AI替代?

要理解这个问题,得先区分两个概念:判别式AI生成式AI
传统量化模型(XGBoost、神经网络等)本质上是判别式的——它们擅长回答:”给定这些因子,明天涨还是跌?”
而大语言模型是生成式的——它们擅长回答:”如果市场处于高波动状态,哪些微观结构指标可能预示着反转?”
前者是”做题”,后者是”出题”。
在量化投资中,”做题”的技术已经高度成熟。你可以用AutoML自动调参,用集成学习自动组合,甚至用强化学习自动优化仓位。
但”出题”——即提出一个逻辑自洽、可解释、可回测的新因子——仍然高度依赖人的洞察力。
举个例子:

人工挖因子的典型路径:观察到”抱团股瓦解时,小市值因子往往失效” → 思考”是否可以用筹码分散度来预警?” → 设计”前十大股东持股比例变化率”因子 → 回测验证 → 优化参数。

这个过程中,“观察到现象→抽象出逻辑→转化为数学表达式”的链条,恰恰是AI最难替代的部分。
但注意,我说的是”最难替代”,不是”不能辅助”。

三、AI因子挖掘的实战范式:从”炼丹”到”人机协同”

目前业内探索出的可行路径,不是让AI凭空创造因子,而是构建“人机协同的因子实验室”

范式一:逻辑延展法

操作方式:给AI一个已验证的市场逻辑,让它生成多维变体。
案例:已知逻辑:”动量因子在牛市有效,熊市失效”。
输入AI后,它可能生成以下延展:
变体A:区分”基本面动量”与”价格动量”,仅在盈利预期上调时启用
变体B:引入波动率调节系数,高波动期降低动量权重
变体C:结合资金流向,仅保留”聪明钱”推动的动量
人的角色:判断哪些变体符合市场机理,筛选可回测的候选集。

范式二:失效诊断法

操作方式:将因子的回撤时段输入AI,让其诊断”病因”并开方。
案例:某价值因子在2021年2月-7月连续回撤。
AI分析后提出假设:

“该时段核心资产估值泡沫化,传统PB/PE指标失效。建议加入’分析师预期修正速度’作为过滤器,仅在预期稳定时启用价值因子。”

回测显示,加入该过滤器后,因子最大回撤从18%降至9%,夏普比率提升0.4。

范式三:跨域迁移法

操作方式:让AI将其他领域的成熟逻辑迁移至量化场景。
案例:从生态学”种群竞争模型”中获得灵感,AI生成”行业龙头市占率变化率”因子——当老二与老大的营收增速差收窄时,预示行业竞争格局恶化,规避该板块。
这类因子的独特价值在于:它来自非金融领域的隐喻,人工团队几乎不可能独立想到。

四、警惕”伪因子陷阱”:为什么AI需要”刹车片”?

2022年,某量化团队曾用遗传规划自动生成因子,三个月内产出上万个表达式,回测胜率极高。
但实盘三个月后,策略净值回撤23%
事后复盘发现:80%的”有效因子”是过拟合产物——它们恰好拟合了历史数据中的随机噪声,而非真实的市场规律。
这正是纯AI挖因子的最大风险:数学上的优美,不等于经济逻辑上的成立。
因此,当前最务实的做法不是”AI全自动挖因子”,而是建立“AI生成+人工审核+快速回测”的三道闸门:
逻辑闸:AI生成的因子必须有可叙述的经济逻辑(不能只是”X的平方根乘以Y的对数”)
稳健性闸:通过样本外测试、参数敏感性分析、不同市场周期验证
可交易闸:考虑换手率、冲击成本、容量限制,排除”纸面富贵”型因子
记住:AI是放大镜,不是滤镜。它能放大你的认知边界,但不能过滤掉你的认知盲区。

五、未来三年,量化研究员的核心竞争力是什么?

如果AI能一分钟生成50个因子候选,那么量化研究员的价值在哪里?
我认为答案藏在三个关键词里:提问力、判断力、连接力。

1. 提问力:从”帮我找个好因子”到”在何种市场状态下,哪些微观结构会预示反转?”

AI的输出质量,高度依赖输入问题的质量。同一个AI,面对模糊提示和精准提示,产出可能天差地别。
未来优秀的量化研究员,首先是“会提问的人”

2. 判断力:在50个候选中,识别出哪3个值得深入

AI可以消除”想不到”的遗憾,但无法替代”选得对”的直觉。
这种直觉来自对市场微观结构的长期观察,来自对无数次回测失效的复盘,来自对人性贪婪与恐惧的深刻理解。

3. 连接力:将另类数据、跨学科逻辑与金融场景嫁接

当AI降低了”生成”的门槛,“连接不同领域知识”的能力反而更加稀缺。
懂气象数据与电力期货的关联、懂半导体周期与库存指标的映射、懂社交媒体情绪与散户行为的共振——这些跨界连接能力,将成为量化研究员的护城河。

结语:铲子与金矿

每一次技术革命,人们总高估”替代”的速度,低估”赋能”的深度。
AI不会在一夜之间让量化投资变成”自动印钞机”。但它正在重塑行业的分工逻辑:
重复性整合→ 交给模型
创造性发现→ 人机协同
战略性判断→ 回归人类
在这场变革中,AI更像一把高效的铲子——它不能替你决定挖哪里,但能让你挖得更快、更深、更省力。
而最终决定你能不能挖到金矿的,仍然是你提问的方向、判断的准度、以及连接不同世界的能力
毕竟,在因子挖掘这场无限游戏里,最大的金矿从来不是某个具体因子,而是持续发现因子的能力本身。

(本文仅供学术交流,不构成投资建议。市场有风险,投资需谨慎。)