最近,一个名为 TradingAgents 的开源项目在GitHub上拿到了5万颗星,登上周榜。它做的事情很直接:用多个AI Agent模拟一个投行团队,从分析师到研究员,从交易员到风控,互相讨论、互相挑战,最后"投票"决定要不要买入一只股票。
听上去很美好——14亿参数的模型,24小时不睡觉帮你分析财报、读新闻、看K线,最后告诉你「买入茅台」或「卖出英伟达」。
但我深入研究了一圈,发现这件事远没有听起来那么性感。
1. TradingAgents 到底做了什么?
先说技术本身。TradingAgents是港大Tauric Research团队做的开源项目,论文发在arXiv上,架构很有意思:
四层Agent流水线:
分析师团队(4个Agent)
基本面分析师:看财务报表、估值 情绪分析师:刷Twitter、Reddit、新闻评论区 财报分析师:读财报电话会 技术分析师:看MACD、RSI、布林带 研究员团队(2个Agent)
多头研究员 vs 空头研究员 两边互相辩论,像券商研究所的内部讨论 交易员
综合所有意见,决定买/卖/持有 风控+组合经理
审核交易提案,控制仓位 最后下单
这个架构确实比单个LLM直接输出「买/卖」要合理——它模拟了真实机构的决策流程。
回测数据是这样的:
这个数据漂亮到有点不真实。Sharpe 8.21是什么概念?一般对冲基金能拿到1.5以上就是优秀水平了。
但这里有个巨大的但是——
⚠️ 官方自己写得很清楚:This framework is designed for research purposes.(这是为研究目的设计的)
它不是实盘交易系统,只是一个模拟环境。
2. 行业全景:不止一个TradingAgents
TradingAgents不是一个人在战斗。GitHub上这类项目已经形成了一个生态:
| ai-hedge-fund | ||
| TradingAgents | ||
| microsoft/qlib | ||
| freqtrade |
ai-hedge-fund 更有趣,它直接让AI扮演具体的投资人:
Warren Buffett Agent:找「护城河」公司 Michael Burry Agent:找被低估的「空头机会」 Cathie Wood Agent:找「颠覆性创新」 Nassim Taleb Agent:关注「黑天鹅」风险
每次分析一只股票,14位「AI股神」同时发表意见,最后投票。
听起来像不像一个AI股神版《奇葩说》?
3. 真实数据:机构 vs 散户的冰火两重天
但是,当我们把目光从开源项目移到真实世界,情况变得非常魔幻。
机构:赚翻
- Vertus
:2025年收益51.15%,Sharpe 2.13,日交易量突破10亿美元 - Bridgewater Pure Alpha II
:34%收益(50年历史最高) - D.E. Shaw Oculus
:28.2%收益
这些是真正在市场上真金白银操作的机构。
散户:亏惨
- NOV1.ai实验
:给6个主流AI模型各1000美元,让它们在Hyperliquid上交易17天 GPT-5:亏掉 >50% Qwen:赚22%(纪律严明,严格止损) DeepSeek:赚5% Claude:亏31% Grok:亏45%(FOMO交易者,追涨杀跌) Gemini:亏57%(过度交易,17天交易238次)
同一个市场,同一套AI模型,有人赚22%,有人亏57%。
你说AI靠谱还是不靠谱?
4. 那些没人告诉你的风险
我研究得越深,发现的问题越多。
风险1:回测数据不可信(Look-Ahead Bias)
一篇最新论文(arXiv:2510.07920)发现了一个致命问题:LLM在回测中表现好,是因为它「偷看」了未来。
LLM的训练数据包含历史价格,当被问到「2024年3月该买什么」时,它实际上是在「回忆」而不是「预测」。
实验数据:
回测后Sharpe比率下降 51%-62% 收益蒸发 50%-72%
这就是所谓的「Profit Mirage」(利润幻象)——回测赚50%,实盘亏50%。
风险2:LLM不擅长数值推理
LLM是语言模型,不是计算模型。
一项研究测试了70+模型,发现它们在处理连续变化的数值时准确率log线性下降 你让它分析一只股票过去10天的价格变化,它能说得头头是道 但你让它算一个简单的复利,它可能算错
Kris Longmore(量化交易博客Robot Wealth)说得特别直接:
"LLMs are brilliant coders but terrible traders. The bug is not a bug—it's a feature of the system."
风险3:Prompt Injection——你的AI可能被「黑客」
研究显示,86%的攻击成功率——攻击者只需要在网页里埋入隐藏指令,就能让AI交易 Agent 乖乖交出密码或转账。
2026年2月,一个叫Lobstar Wilde的事件:
工程师的AI Agent本想转4 SOL(约310美元) 实际转了5200万枚代币(约44万美元) 原因:一位小数点错误 + 状态管理失败
这不是AI「背叛」人类,是人类自己的bug。
风险4:策略同质化——新的「闪电崩盘」
2026年2月,15,000-20,000个AI Agent同时执行相同策略,导致4亿美元流动性在3秒内蒸发。
这就是「February Wick事件」——AI没有心思想象力,但有无与伦比的从众能力。
当所有人都用相似的AI、相似的策略、相似的数据源,市场会变得极度脆弱。
专家警告:当策略同质化系数ρ > 0.65时,系统性风险概率急剧上升。
5. 专家怎么说?
我整理了一圈行业专家的观点,发现一个有趣的共识:
「不靠谱派」
Eden Simmer,Pimco全球股票交易主管:
"大涨的时候,第一件事就是关掉机器,找人。AI是基于历史数据和预测分析的,但谁能预测Trump下一步做什么?"
Ilya Navogitsyn,量化开发者:
"LLM不会发明alpha。它们最擅长的是压缩思考——省时间。它们最不擅长的是信号发现、新假设生成、实盘决策。"
「 Hybrid派」
Bryan Benson,Aiurum Foundation CEO:
"AI不会取代交易员——但会移除他们最糟糕的决策。AI的优势不是智能,是情绪中性。人类控制策略,AI控制执行。"
Igor Stadnyk,True Trading联合创始人:
"从技术上讲,自动交易已经可以实现。问题不是执行,是控制、限制和问责。策略选择和风险仍然是人的决定。"
数据怎么说?
- Bloomberg调查
:151位量化分析师中,54%不使用生成式AI做投资 - Gartner预测
:到2027年,40%的agentic AI项目会被取消 - 只有29%
的机构在部署AI Agent时做好了安全准备 - 88%
的机构在使用AI Agent时遇到过安全事件
6. 结论:AI量化交易靠谱吗?
我的结论是:分情况。
对于机构:AI已经是一把利器,但不是银弹。
Vertus 51%的收益不是因为AI「预测」对了,而是因为它有机构级的基础设施、风控体系、数据源 AI处理执行,人类做策略决策,这是当前的主流模式
对于散户:AI大概率是镰刀,不是提款机。
92.4%的Polymarket AI交易者亏损 80%标榜「AI」的交易平台只是RSI/MACD指标的Python包装 散户缺的不仅是AI模型,更是风控纪律、仓位管理、信号源
对于行业:Multi-Agent是一个有趣的方向,但它解决的是「决策流程」问题,不是「预测准确」问题。
TradingAgents这个项目最大的价值不是让你赚钱,而是让你理解一个AI驱动的交易团队是如何工作的——这本身就是一种认知升级。
7. 写在最后
回到开头的问题:AI量化交易靠谱吗?
我的答案是:它靠谱的程度,取决于用它的人靠谱的程度。
AI可以:
✅ 帮你快速读财报、筛数据 ✅ 帮你克服情绪化交易 ✅ 帮你执行纪律
AI不能:
❌ 预测黑天鹅 ❌ 理解「谁给你钱,为什么」这种本质问题 ❌ 替你承担责任
正如一位匿名交易员说的:
"AI交易 bot 在速度、规模、纪律和数据处理上赢了。人类交易员在语境、创造力、战略思维和应对真正前所未有事件上赢了。持续盈利的人,是把两者结合起来的人。"
在这个时代,最强的交易员不是最懂AI的人,而是最懂什么时候该用AI、什么时候该关掉AI的人。
夜雨聆风