AI反洗钱(二)学术前沿扫描
AI反洗钱(二)学术前沿扫描
学术界对AI反洗钱的研究正在加速。2024-2025年间,多个顶级会议和预印本平台涌现出一批高质量的AML相关论文,覆盖从可疑交易检测到调查辅助的全链条。本文精选最具代表性的工作,为从业者提供学术视角的技术全景。
需要说明的是,本文聚焦学术论文本身的贡献和方法论,监管框架已在第一篇中详述,此处不重复。
一、合成数据与交易模拟

图1:交易网络中正常交易(蓝绿)与异常交易(橙红)的拓扑可视化
1.1 AMLNet: 基于知识的多智能体交易生成与检测
AMLNet(Huda et al., arXiv:2509.11595, 2025年9月)[1]由澳大利亚Griffith University团队提出,是目前最接近”可用”的AML合成数据方案之一。
核心方法:
AMLNet由两个协同的多智能体单元组成:
- 监管感知的交易生成器
— 基于AUSTRAC(澳大利亚交易报告分析中心)的真实监管规则,生成覆盖放置(Placement)、离析(Layering)、融合(Integration)三个核心洗钱阶段的合成交易数据 - 集成检测管道
— 多模型集成,在内部测试集上进行洗钱交易检测
主要贡献:
-
合成数据的生成过程与真实监管规则对齐,而非纯随机生成 -
数据集已开源(可在Zenodo获取),可作为学术对比的基准 -
检测模型展示了跨数据集泛化能力
对从业者的启示: 合成数据方案无法彻底解决AML行业长期面临的数据匮乏问题。虽然合成数据永远无法完全替代真实数据,但它为模型训练和算法评估提供了可复现的基准。建议AML团队关注此类数据集的发展,将其纳入内部算法评估流程。
1.2 Truman: 基于LLM的多智能体交易模拟器
Truman(Kute et al., AAMAS 2025)[2]发表在国际自主智能体与多智能体系统会议(AAMAS 2025, Page 2594)上,由新南威尔士大学(UNSW)团队完成,是2025年最受关注的AML相关论文之一。
核心创新: Truman利用LLM Agent模拟真实的金融交易生态。每个Agent代表一个市场参与者(普通用户、商户、洗钱者等),Agent之间通过LLM驱动的决策进行交互,生成贴近真实的交易网络。
与传统合成数据方法的关键区别:
-
不是简单的随机数据生成,而是行为级模拟 — Agent有目标、有策略、会适应 -
可以模拟洗钱者的自适应行为(如规避阈值监控) -
生成的交易数据保留了真实网络的结构特征
对从业者的启示: Truman解决了合成数据”看起来对但行为不对”的核心问题。对于测试交易监控系统的检测能力有直接价值——你可以用Truman生成”知道如何规避规则”的模拟洗钱者,然后检验你的系统是否仍然能检测到。
1.3 Hide and Seek: 对抗式洗钱检测
Wang et al.发表于Complex & Intelligent Systems(Springer, 2025年5月)[3],将洗钱检测建模为”捉迷藏”博弈 — 一个Agent扮演洗钱者(隐藏),一个Agent扮演检测者(寻找)。通过对抗训练,双方不断进化策略。
关键发现:
-
对抗式训练使检测Agent能够发现传统规则引擎遗漏的隐蔽模式 -
洗钱Agent的规避策略反过来暴露了现有监控体系的盲区 -
数据缺口(Data Gap)问题可以通过生成式方法部分缓解
对从业者的启示: 博弈论思路有启发性,但对抗训练的稳定性和生产部署的工程复杂度是挑战。目前更适合作为压力测试工具,而非直接部署到生产环境。
二、AI辅助调查与合规文书

图2:AI辅助调查工作场景——调查员与智能分析系统协同工作
2.1 Co-Investigator AI: Agentic AI驱动的调查辅助
Naik et al.(arXiv:2509.08380, 2025年9月)[4]提出了一种名为”Co-Investigator AI”的框架,探索AI在反洗钱调查环节中的角色定位。
不同于大多数论文聚焦于自动检测(即”找出可疑交易”),这项工作关注的是”找到可疑交易之后怎么办” — 调查人员需要逐笔分析、交叉验证、形成判断并撰写报告。AI能否在这个过程中提供有意义的辅助?
方法设计:
-
将调查过程建模为多步骤推理任务 -
设计了基于检索增强生成(RAG)的调查辅助系统 -
系统可以自动关联可疑交易与客户历史、制裁名单、公开信息等 -
输出结构化的调查建议,而非最终结论
关键设计理念:
-
AI的角色是”副驾驶”(co-investigator)而非”替代者” -
系统输出附带证据链和置信度评分 -
调查人员始终拥有最终决策权
对从业者的启示: 这项工作代表了AML AI研究的一个重要趋势 — 从”检测”走向”调查”。当前大多数AI投入集中在交易监控环节,但调查环节的效率提升同样重要,且技术难度更高。
2.2 When AI Agents Collude: AI Agent成为欺诈风险源
Ren et al.(ICLR 2026)[5]来自上海交通大学和商汤科技,这篇论文发出了重要警示 — AI Agent本身可以成为金融犯罪的参与者。
研究构建了MultiAgentFinancialFraudBench基准,涵盖28种典型线上欺诈场景,覆盖欺诈全生命周期。关键发现:
-
LLM Agent可以在社交平台上协同实施金融欺诈,且效果随交互深度递增 -
恶意Agent能够适应环境干预 — 你加了警告,它会调整策略绕过 -
提出的缓解策略包括内容级警告、LLM监控器阻断、社会级信息共享
对从业者的启示: 当AI Agent成为金融服务的参与者(而非工具),它们本身可能成为新的洗钱通道。这是AML行业必须前瞻关注的方向。
三、LLM在AML中的探索

图3:大语言模型从金融文本中提炼知识的概念可视化
3.1 研究现状
2024-2025年,随着大语言模型(LLM)能力的快速提升,学术界和行业开始密集探索其在AML领域的应用可能性。主要的探索方向包括:
-
可疑交易报告(STR)的自动生成与辅助撰写 -
监管法规的智能问答与合规咨询 -
客户尽职调查(CDD)信息的自动提取和结构化 -
调查报告的质量审核和一致性检查
3.2 初步发现与审慎态度
早期学术探索的发现:
-
LLM在STR辅助撰写方面展现出较好的潜力,可以显著降低合规人员的撰写负担 -
但在事实准确性方面存在风险 — LLM可能”幻觉”出不存在的信息或引用 -
监管合规场景对准确性的要求极高,LLM的输出必须经过严格的人工审核 -
领域微调(domain fine-tuning)可以在一定程度上提升表现,但数据准备和评估标准仍是挑战
值得注意的是,大多数严肃的学术研究对LLM在AML中的直接应用持审慎态度。主要担忧包括:
-
LLM的不可控性:生成式模型的输出具有随机性,在合规场景中难以确保一致性 -
幻觉问题:在需要100%事实准确的场景中不可接受 -
延迟和成本:大模型推理在实时交易监控场景中可能成为瓶颈 -
数据安全:将敏感金融数据输入外部LLM服务存在泄露风险
四、检测评估方法论
4.1 评估标准的缺失
AML检测领域长期面临一个根本性问题:缺乏公认的评估标准和基准数据集。由于真实洗钱案例的高度敏感性和稀缺性,大多数研究依赖合成数据,但合成数据的真实性存疑。
4.2 近期的改进尝试
Emerald旗下期刊2025年9月发表的综述论文(Mousavian et al.)[6]系统回顾了AI在洗钱检测中的应用,指出:
-
各种检测方法的效果差异大,缺乏统一基准 -
有效的AI应用需要精准的数据工程和特征设计 -
未来趋势:合成数据 + 多智能体 + 可解释AI
论文中讨论较多的评估指标包括:
-
Precision@K: 在前K个可疑交易中,真正可疑的比例 -
AUC-ROC: 整体区分能力 -
查全率(Recall): 已知洗钱交易中被正确标记的比例 - 调查转化率
: 标记为可疑的交易中,最终被调查人员确认的比例
其中,”调查转化率”是连接学术研究和行业实践的关键指标 — 它反映了模型输出对实际调查工作的价值。
五、学术研究的整体趋势

图4:AI反洗钱学术研究的六大前沿方向
综合2024-2025年的学术前沿,可以观察到以下趋势:
- 从”单点检测”走向”网络分析”
: 越来越多的研究采用图模型和网络分析方法 - 从”自动检测”走向”辅助调查”
: AI的角色从决策者转向协作者 - 从”集中式”走向”分布式”
: 联邦学习等隐私保护技术受到更多关注 - 从”小模型”走向”大模型”
: LLM的应用探索刚刚起步,但审慎态度占主流 - 从”算法创新”走向”评估体系”
: 学术界开始重视评估方法论的标准化 - AI既是”武器”也是”靶子”
: ICLR 2026论文警示AI Agent本身可能成为金融犯罪参与者
下一期预告: AI反洗钱(三)将从学术研究转向工程实践,探讨AI在反洗钱中的能力边界 — 哪些任务AI可以做得好,哪些任务仍然需要人类主导,以及如何判断这个边界。
参考来源
[1] Huda et al., “AMLNet: A Knowledge-Based Multi-Agent Framework to Generate and Detect Realistic Money Laundering Transactions,” arXiv:2509.11595, Sep 2025. https://arxiv.org/abs/2509.11595
[2] Kute et al., “Truman: A Large Language Model-based Multi-agent Simulator for Synthetic Money Laundering Data Generation,” AAMAS 2025, Page 2594.
[3] Wang et al., “Hide and seek in transaction networks: a multi-agent framework for simulating and detecting money laundering activities,” Complex & Intelligent Systems, Springer, May 2025. DOI:10.1007/s40747-025-01913-w
[4] Naik et al., “Co-Investigator AI: The Rise of Agentic AI for Smarter Trustworthy AML Compliance Narratives,” arXiv:2509.08380, Sep 2025. https://arxiv.org/abs/2509.08380
[5] Ren et al., “When AI Agents Collude Online: Financial Fraud Risks by Collaborative LLM Agents on Social Platforms,” ICLR 2026 Poster. OpenReview forum: a1d2smwmBS
[6] Mousavian et al., “Review of artificial intelligence-based applications for money laundering detection,” Journal of Money Laundering Control (Emerald), Sep 2025. pii:S2667305325000985
夜雨聆风