AI量化交易靠谱吗?一个开源项目引发的深思

最近，一个名为 TradingAgents 的开源项目在GitHub上拿到了5万颗星，登上周榜。它做的事情很直接：用多个AI Agent模拟一个投行团队，从分析师到研究员，从交易员到风控，互相讨论、互相挑战，最后"投票"决定要不要买入一只股票。

听上去很美好——14亿参数的模型，24小时不睡觉帮你分析财报、读新闻、看K线，最后告诉你「买入茅台」或「卖出英伟达」。

但我深入研究了一圈，发现这件事远没有听起来那么性感。

1. TradingAgents 到底做了什么？

先说技术本身。TradingAgents是港大Tauric Research团队做的开源项目，论文发在arXiv上，架构很有意思：

四层Agent流水线：

分析师团队（4个Agent）

基本面分析师：看财务报表、估值
情绪分析师：刷Twitter、Reddit、新闻评论区
财报分析师：读财报电话会
技术分析师：看MACD、RSI、布林带

研究员团队（2个Agent）

多头研究员 vs 空头研究员
两边互相辩论，像券商研究所的内部讨论

交易员

综合所有意见，决定买/卖/持有

风控+组合经理

审核交易提案，控制仓位
最后下单

这个架构确实比单个LLM直接输出「买/卖」要合理——它模拟了真实机构的决策流程。

回测数据是这样的：

股票	收益	Sharpe比率
AAPL	26.62%	8.21
GOOGL	24.36%	6.39
AMZN	23.21%	5.60

这个数据漂亮到有点不真实。Sharpe 8.21是什么概念？一般对冲基金能拿到1.5以上就是优秀水平了。

但这里有个巨大的但是——

⚠️ 官方自己写得很清楚：This framework is designed for research purposes.（这是为研究目的设计的）
它不是实盘交易系统，只是一个模拟环境。

2. 行业全景：不止一个TradingAgents

TradingAgents不是一个人在战斗。GitHub上这类项目已经形成了一个生态：

项目	Stars	特点
ai-hedge-fund	52.6k	模拟14位投资大师人格（巴菲特、芒格、达摩达兰、比尔·阿克曼、凯西·伍德...）
TradingAgents	50k	模拟投行团队协作
microsoft/qlib	40.6k	微软开源量化平台
freqtrade	48.6k	加密货币交易机器人

ai-hedge-fund 更有趣，它直接让AI扮演具体的投资人：

Warren Buffett Agent：找「护城河」公司
Michael Burry Agent：找被低估的「空头机会」
Cathie Wood Agent：找「颠覆性创新」
Nassim Taleb Agent：关注「黑天鹅」风险

每次分析一只股票，14位「AI股神」同时发表意见，最后投票。

听起来像不像一个AI股神版《奇葩说》？

3. 真实数据：机构 vs 散户的冰火两重天

但是，当我们把目光从开源项目移到真实世界，情况变得非常魔幻。

机构：赚翻

Vertus
：2025年收益51.15%，Sharpe 2.13，日交易量突破10亿美元
Bridgewater Pure Alpha II
：34%收益（50年历史最高）
D.E. Shaw Oculus
：28.2%收益

这些是真正在市场上真金白银操作的机构。

散户：亏惨

NOV1.ai实验
：给6个主流AI模型各1000美元，让它们在Hyperliquid上交易17天

GPT-5：亏掉 >50%
Qwen：赚22%（纪律严明，严格止损）
DeepSeek：赚5%
Claude：亏31%
Grok：亏45%（FOMO交易者，追涨杀跌）
Gemini：亏57%（过度交易，17天交易238次）

同一个市场，同一套AI模型，有人赚22%，有人亏57%。

你说AI靠谱还是不靠谱？

4. 那些没人告诉你的风险

我研究得越深，发现的问题越多。

风险1：回测数据不可信（Look-Ahead Bias）

一篇最新论文（arXiv:2510.07920）发现了一个致命问题：LLM在回测中表现好，是因为它「偷看」了未来。

LLM的训练数据包含历史价格，当被问到「2024年3月该买什么」时，它实际上是在「回忆」而不是「预测」。

实验数据：

回测后Sharpe比率下降 51%-62%
收益蒸发 50%-72%

这就是所谓的「Profit Mirage」（利润幻象）——回测赚50%，实盘亏50%。

风险2：LLM不擅长数值推理

LLM是语言模型，不是计算模型。

一项研究测试了70+模型，发现它们在处理连续变化的数值时准确率log线性下降
你让它分析一只股票过去10天的价格变化，它能说得头头是道
但你让它算一个简单的复利，它可能算错

Kris Longmore（量化交易博客Robot Wealth）说得特别直接：

"LLMs are brilliant coders but terrible traders. The bug is not a bug—it's a feature of the system."

风险3：Prompt Injection——你的AI可能被「黑客」

研究显示，86%的攻击成功率——攻击者只需要在网页里埋入隐藏指令，就能让AI交易 Agent 乖乖交出密码或转账。

2026年2月，一个叫Lobstar Wilde的事件：

工程师的AI Agent本想转4 SOL（约310美元）
实际转了5200万枚代币（约44万美元）
原因：一位小数点错误 + 状态管理失败

这不是AI「背叛」人类，是人类自己的bug。

风险4：策略同质化——新的「闪电崩盘」

2026年2月，15,000-20,000个AI Agent同时执行相同策略，导致4亿美元流动性在3秒内蒸发。

这就是「February Wick事件」——AI没有心思想象力，但有无与伦比的从众能力。

当所有人都用相似的AI、相似的策略、相似的数据源，市场会变得极度脆弱。

专家警告：当策略同质化系数ρ > 0.65时，系统性风险概率急剧上升。

5. 专家怎么说？

我整理了一圈行业专家的观点，发现一个有趣的共识：

「不靠谱派」

Eden Simmer，Pimco全球股票交易主管：

"大涨的时候，第一件事就是关掉机器，找人。AI是基于历史数据和预测分析的，但谁能预测Trump下一步做什么？"

Ilya Navogitsyn，量化开发者：

"LLM不会发明alpha。它们最擅长的是压缩思考——省时间。它们最不擅长的是信号发现、新假设生成、实盘决策。"

「 Hybrid派」

Bryan Benson，Aiurum Foundation CEO：

"AI不会取代交易员——但会移除他们最糟糕的决策。AI的优势不是智能，是情绪中性。人类控制策略，AI控制执行。"

Igor Stadnyk，True Trading联合创始人：

"从技术上讲，自动交易已经可以实现。问题不是执行，是控制、限制和问责。策略选择和风险仍然是人的决定。"

数据怎么说？

Bloomberg调查
：151位量化分析师中，54%不使用生成式AI做投资
Gartner预测
：到2027年，40%的agentic AI项目会被取消
只有29%
的机构在部署AI Agent时做好了安全准备
88%
的机构在使用AI Agent时遇到过安全事件

6. 结论：AI量化交易靠谱吗？

我的结论是：分情况。

对于机构：AI已经是一把利器，但不是银弹。

Vertus 51%的收益不是因为AI「预测」对了，而是因为它有机构级的基础设施、风控体系、数据源
AI处理执行，人类做策略决策，这是当前的主流模式

对于散户：AI大概率是镰刀，不是提款机。

92.4%的Polymarket AI交易者亏损
80%标榜「AI」的交易平台只是RSI/MACD指标的Python包装
散户缺的不仅是AI模型，更是风控纪律、仓位管理、信号源

对于行业：Multi-Agent是一个有趣的方向，但它解决的是「决策流程」问题，不是「预测准确」问题。

TradingAgents这个项目最大的价值不是让你赚钱，而是让你理解一个AI驱动的交易团队是如何工作的——这本身就是一种认知升级。

7. 写在最后

回到开头的问题：AI量化交易靠谱吗？

我的答案是：它靠谱的程度，取决于用它的人靠谱的程度。

AI可以：

✅ 帮你快速读财报、筛数据
✅ 帮你克服情绪化交易
✅ 帮你执行纪律

AI不能：

❌ 预测黑天鹅
❌ 理解「谁给你钱，为什么」这种本质问题
❌ 替你承担责任

正如一位匿名交易员说的：

"AI交易 bot 在速度、规模、纪律和数据处理上赢了。人类交易员在语境、创造力、战略思维和应对真正前所未有事件上赢了。持续盈利的人，是把两者结合起来的人。"

在这个时代，最强的交易员不是最懂AI的人，而是最懂什么时候该用AI、什么时候该关掉AI的人。