
AI Agent 在金融领域的应用正从“概念验证”走向“深度实战”,主要体现在多智能体协作(Multi-Agent)、自主验证(Self-Validating)以及企业级工作流(Enterprise Workflow)三个方向。 本文深度拆解 GitHub 上三个最具代表性的金融 AI Agent 项目,对比分析其技术架构与适用场景,并探讨如何结合 Hermes Agent 进行本土化增强与自动化集成,为量化交易员、研究员及金融从业者提供选型指南。
金融圈的Agent赛道,最近终于从“讲故事”进化到了“拼刺刀”的阶段。
过去大家玩Agent,顶多就是写个Prompt让它分析下新闻情绪,或者做个简单的图表。但现在开源社区已经拿出能直接嵌入交易和研究工作流的硬核框架。
今天挑了三个最近GitHub上非常火的项目,代表了三种完全不同的路子:
TradingAgents (Tauric Research):模拟华尔街投行架构,多个 Agent 互相辩论做交易决策。 Dexter (virattt):一个能“自我反思”的超级金融研究员,自动扒财报、写研报、自己校验结论。 Financial Services (Anthropic):Anthropic官方出品,零代码配置,直接对接 FactSet、S&P等金融数据终端。
这三套东西,到底哪一套适合你?怎么在你的业务里跑起来?看完这篇,心里就有数了。
01 TradingAgents:模拟华尔街的“辩论式”交易
项目:TauricResearch/TradingAgents (71k+ Stars) 关键词:LangGraph、多智能体协作、模拟交易
这个项目最牛的地方在于它的架构设计——它不是让一个LLM干所有事,而是复刻了一个真实交易公司的组织架构。
它的逻辑非常清晰:
分析师团队 (Analyst Team): 基本面分析师:看财报、算估值。 情绪分析师:扒社交媒体,看散户情绪。 新闻分析师:解读宏观新闻。 技术分析师:算MACD、RSI,看K线形态。 研究员团队 (Researcher Team): 多头 vs 空头:这两个Agent专门负责互相抬杠(辩论),平衡风险收益比。 交易员 (Trader Agent): 综合所有报告,决定买卖时机和仓位大小。 风控经理 (Risk Manager): 评估波动率,如果风险太大,直接否决交易。
核心亮点: 它用的是 LangGraph 框架,支持 辩论式决策 (Debate-driven)。比如研究员团队的多头和空头会进行多轮辩论,直到达成某种共识,或者把冲突点暴露给交易员。

而且,v0.2.4版本已经支持了Checkpoint断点续传和持久化记忆,意味着它可以记住之前的交易记录,不断迭代策略。
02 Dexter:会自我纠错的“超级研究员”
项目:virattt/dexter (24k+ Stars) 关键词:自主研究、自我验证、WhatsApp交互
如果说TradingAgents是用来交易的,那Dexter就是用来做深度研究的。
它的自我介绍很有意思:“Think Claude Code, but built specifically for financial research.”(想想Claude Code,但专为金融研究而生。)
它的工作流是这样的:
Plan (规划):你给它一个复杂的指令(比如“分析一下特斯拉最近的财务状况”),它会先把任务拆解成一步步的计划。 Act (执行):自动调用工具去抓取实时数据(资产负债表、现金流量表等)。 Self-Validation (自我验证):这是它最核心的功能。它不会直接把结果扔给你,而是会自己检查:“这个数据对不对?逻辑通不通?有没有遗漏?”如果不通过,它会自己重新查,直到满意为止。
核心亮点:
Bun + TypeScript 技术栈:跑得飞快,比Python脚本轻灵得多。 WhatsApp 集成:你可以直接在WhatsApp上跟它对话,它做完研究直接把报告发到你的手机上。 LangSmith 评估:自带评估套件,可以用LLM当裁判,测试它回答金融问题的准确率。
03 Financial Services (Anthropic):企业级的“金融全家桶”
项目:anthropics/financial-services关键词:Anthropic官方、零编译、MCP数据连接器
这是Anthropic官方发布的金融Agent示例库,定位非常明确:企业级工作流。
它不是让你拿来做量化交易的,而是为了解决投行、私募、财富管理里的实际脏活累活。
它内置了 10 个开箱即用的 Agent:
Pitch Agent:自动做comps(可比公司分析)、precedents,生成Pitch Deck。 Model Builder:直接在Excel里建DCF、LBO模型。 Earnings Reviewer:听完财报电话会议,自动更新模型,起草研报。 KYC Screener:解析客户文档,进行合规审查。
核心亮点:
零编译:全Markdown + YAML配置。不需要写代码,改改配置就能跑。 MCP 数据连接器:直接支持 FactSet, S&P Global, Morningstar 等顶级金融数据源(当然,你得有账号)。 多端部署:既可以在Claude Cowork (UI) 里当插件用,也可以作为Claude Managed Agent (Headless) 跑在服务器上。
04 三个项目横向对比
为了方便大家选型,我把这三个项目的核心维度拉了个表:
| 核心定位 | |||
| 适合人群 | 量化交易员 / 策略开发者 | 行业研究员 / 投资人 | 投行 / PE / 财富管理 |
| 技术栈 | |||
| Agent 数量 | |||
| 数据源 | |||
| 部署难度 | |||
| 开源协议 |
05 如何叠加 Hermes Agent 进行深度使用?
这三个项目都很强,但如果直接拿来在国内用,大概率会遇到数据水土不服、部署繁琐的问题。
这时候,就可以叠加 Hermes Agent 来做一个“超级中间件”。
1. 数据源本土化适配 (针对 TradingAgents)
TradingAgents默认用的是Yahoo Finance,这对A股支持不好。 Hermes 解法:利用Hermes Agent强大的代码生成能力,编写一个适配 Tushare 或 AkShare 的工具类,替换掉原有的数据获取模块。Hermes可以自动扫描代码库,找到所有调用Yahoo Finance的地方,进行批量替换和测试。
2. 研报流自动化 (针对 Dexter)
Dexter能出研报,但发在WhatsApp上对国内用户没用。 Hermes 解法:将Hermes Agent作为Dexter的输出接收器。Dexter生成的JSONL研报数据,通过Webhook推送到Hermes,Hermes利用其已具备的排版Skills,自动生成微信的推文,或者直接推送到QQ/飞书/钉钉群里。
3. 策略回测与代码审查 (通用)
不管是TradingAgents的策略,还是Anthropic的Excel模型,代码质量都很关键。 Hermes 解法:利用Hermes的 delegate_task 功能,建立一个“代码审查 Agent”。每次修改策略代码后,Hermes自动运行测试用例,生成覆盖率报告,甚至可以用LLM审查代码逻辑是否存在幸存者偏差。
06 总结:你该选哪个?
如果你是量化交易员: 别犹豫,选 TradingAgents。LangGraph的多Agent架构非常适合做复杂的因子挖掘和组合管理。配合Hermes Agent把数据源换成A股,你就能得到一个初级的“AI 量化投研助手”。
如果你是行业研究员: Dexter 是你的好搭子。它那个“自我验证”的机制,能帮你省下大量核对数据的时间。特别是它支持多种LLM切换,你可以用便宜的模型做初筛,用贵的模型做最终分析。
如果你在投行或 PE 做 Deal: Anthropic Financial Services 是最现成的方案。只要你有FactSet账号,接上就能用。它能帮你把Pitch Book的制作时间从3天压缩到3小时。
最后提醒一句:AI Agent 只是工具,不是水晶球。 金融市场瞬息万变,模型会幻觉,数据会延迟。 在真金白银下场之前,记得多做Backtest,多留Safety Margin。
祝你好运吧。
Day 18

⚠️ 风险提示:本文提及的开源项目、代码框架及技术分析仅供技术交流与学习参考,不构成任何投资建议。AI 模型存在幻觉风险,金融市场瞬息万变,请务必独立判断,谨慎决策。
夜雨聆风