当两个AI Agent自主谈判如何预测对手行为

━━━━━━━━━━━━━━━━━━━━━━━━━

当两个AI Agent开始在没有任何人类介入的情况下自主谈判，一个买家机器人和一个卖家机器人来回出价，它们的对话会发生什么？一方会用什么策略来最大化自己的利益？另一方会如何回应？当一方改变了策略，另一方能否察觉并随之调整？

这个问题在几年听起来还像科幻，但2026年的AI研究者已经开始认真研究它了。在arXiv最新发表的论文《Predicting Decisions of AI Agents from Limited Interaction through Text-Tabular Modeling》中，研究者提出了一个非常具体但又极具普遍意义的问题：当一个AI Agent面对一个它完全不熟悉的交易对手时，能不能只通过几轮对话和互动历史，预测对方下一步会做什么？

这个问题听起来抽象，但它有非常直接的现实意义。当AI Agent开始进入电子商务自动采购、合同条款谈判、服务级别协议制定这些场景时，它们之间的互动会越来越频繁。而这些互动里有一个根本性的信息不对称：每个Agent的内部逻辑——用了什么LLM、什么提示词工程、什么控制规则、什么回退策略——对对方来说都是黑箱。但每一个决策，都可能带来真实的货币后果。一次错误的接受报价可能导致采购成本虚高，一次失策的还价可能导致供应商放弃谈判。对于部署这些Agent的企业来说，能预测对手行为的Agent就是有竞争优势的Agent。

【它研究的核心问题是什么】

这篇论文研究的核心问题叫做目标适应型文本表格预测(target-adaptive text-tabular prediction)，这个名字听起来很技术，但它描述的场景其实很直观。

具体来说，场景是这样的：在受控的议价和谈判游戏里，一个Agent需要预测另一个完全不熟悉的Agent的下一步决策。每次决策点构成一行数据，结合了三个层面的信息：结构化的游戏状态特征（比如当前是第几轮、双方的初始出价是多少、之前双方各自报价的历史轨迹）、历史报价的数值序列，以及对话的文本内容。研究提供的条件是K轮与同一个目标Agent互动过的历史对话，这些对话都附带了标注——即每轮最终做的是什么决策。

模型的输入格式是表格化的，但其中包含了大量的非结构化文本。这种混合形态在真实世界里其实很常见：商业决策既涉及数值指标，也涉及语言表达。论文的创新点在于它对这种混合形态的处理方式。

这里最关键的一个创新叫LLM-as-Observer。这个概念需要仔细理解，因为它和我们平时对LLM的使用方式非常不同。我们通常把LLM当作一个直接预测器：你问它一个问题，它给出一个回答，这个回答就是预测结果。但在LLM-as-Observer的框架里，一个小型的冻结LLM被用来读取决策时的状态和对话内容，它的回答本身被直接丢弃——注意，这里不是让LLM做预测后忽略预测结果，而是让LLM产生回答，然后丢弃回答本身，只保留它的隐藏状态(hidden states)。

为什么要这样做？因为LLM在处理和回答一个问题时，它的内部激活模式会包含远比最终回答更丰富的信息。这些激活模式本质上是对输入的一种深度编码，捕捉了LLM在理解当前状态时用到的各种抽象特征。把这些隐藏状态当作特征向量来使用，相当于把一个训练好的大语言模型当作一个强大的特征提取器，但它不是在做预测任务，而是在做理解任务。这两者之间的区别非常关键：直接预测时，LLM需要根据few-shot示例直接输出判断结果；而作为Observer时，LLM在学习理解对手的决策模式，这个任务更接近于对行为规律的归纳，而不是对话风格的模仿。

【为什么这在商业上有价值】

理解这个研究为什么有价值，需要先理解AI Agent在现实商业场景里遇到的具体问题。

考虑一个实际发生中的商业场景。某家电商平台开始用AI Agent帮商家自动谈判批发价格。平台方的Agent需要和大量不知名的供应商Agent互动——这些供应商的Agent用了什么LLM、什么提示词、什么控制逻辑，平台方完全不知道，也不可能知道。但它必须做出决策：是接受当前报价，还是继续还价，还是直接放弃这个供应商转向下一个。每一个决策都涉及真实的金钱：接受一个虚高的价格意味着采购成本上升，还价太激进可能导致供应商流失，还价太保守则可能错过更好的交易机会。

在传统的Few-shot Prompting框架下，平台方的Agent可以给历史上见过的供应商Agent对话作为示例，让它推测当前供应商的行为。但这有一个根本缺陷：few-shot预测依赖示例的质量和数量。当当前供应商的行为模式超出示例范围时，预测就会失效。而且，直接让一个LLM通过对话内容预测对方决策，实际上是在让LLM扮演一个人类角色——它需要根据有限的例子推断对手的策略和偏好——而不是在学习理解对手的系统性决策规律。这是一个更难的学习任务，需要更多的示例才能做好。

LLM-as-Observer的方法绕过了这个问题。它不是让一个LLM去模拟另一个LLM的行为输出，而是利用冻结LLM的隐藏状态来提取决策相关的信号。本质上，这是一个特征工程问题，只不过特征来自LLM的内部表征，而不是人工设计的规则或统计特征。这和深度学习在计算机视觉领域的历程很像：早期人们手工设计特征（边缘、纹理、形状描述子），后来发现深度网络能够从数据中自动学习更好的特征表示。现在，同样的逻辑正在迁移到AI Agent行为建模领域。

【实验结果说明了什么】

研究者在13个前沿LLM Agent上进行训练，然后在91个保留的scaffolded Agent上进行测试。这个跨度的测试设计很重要：scaffolded Agent是用规则、提示词和控制逻辑构建的代理，而非直接的LLM调用。这意味着测试的对手在行为模式上是多样化的，并非都来自同一个基础模型的不同配置。这种设定更接近真实世界的情况：真实的商业对手可能运行着完全不同的系统，有着完全不同的行为特征。

结果显示，在K=16（即提供16轮历史交互作为示例）的情况下，使用Observer特征的完整模型比直接LLM-as-Predictor prompting和游戏加文本特征基线方法的响应预测AUC高约4个百分点，议价报价预测误差降低14%。

这些数字在机器学习领域里听起来不算巨大的幅度，但需要考虑实验条件的高难度：对手是多样化的、未知的，预测窗口只有几轮历史。4个点的AUC提升意味着在所有其他条件相同的情况下，这个模型能更准确地判断"对方会接受还是拒绝当前报价"。14%的预测误差降低则意味着报价预测的平均偏差缩小了将近七分之一。对于一个自动采购系统来说，如果能够更准确地预测供应商的报价策略，它就能制定更好的还价策略，或者判断什么时候应该停止谈判、接受当前报价。这个能力在竞争激烈的采购场景里是可以转化为真实利润的。

值得注意的是Observer特征在实验中的贡献。研究者做了消融实验，对比了有Observer特征和没有Observer特征两种条件下的模型表现。结果显示，Observer特征在两个任务上都有正向贡献，而且这个贡献与游戏状态特征和对话特征是正交的——也就是说，它提供的是额外的信息，而不是重复的信息。这印证了LLM-as-Observer这个思路的有效性：冻结的大语言模型确实捕捉到了决策相关的信号，而这些信号在直接的few-shot prompting中是无法被利用的。

【从研究到实践的路径】

这个研究目前还停留在受控实验阶段，真实商业场景的复杂度远超论文中的谈判游戏。但它的方向有几个值得注意的实践含义。

第一，对AI Agent开发者的启示。当你的Agent需要和其他不透明的Agent互动时，最可靠的不是让模型直接猜测对方行为——尤其是在对方的行为空间很大、历史示例很少的情况下。更可靠的方式是通过某种方式提取对方决策模式里的一致性规律。这可能意味着需要更多的可观测性工具，或者行业范围内标准化Agent行为描述格式的讨论。在多Agent系统越来越普遍的将来，"如何理解你不知道内部逻辑的对手"这个问题会变得越来越重要。

第二，对企业部署AI Agent的启示。越来越多的企业开始考虑用多Agent系统来自动化商业流程。在这种架构里，不同的Agent可能属于不同的供应商、不同的业务线，甚至完全不同的公司。如果系统能够通过观察历史交互来预测其他Agent的行为，这相当于在系统层面多了一层博弈分析能力。这对自动采购、合同谈判、争议解决等场景都有直接价值。想象一个谈判Agent能够根据对手的历史出价模式，判断当前报价是否处于合理区间，以及继续还价的期望收益是否足够大。这个能力在以前需要专业的谈判专家才能提供，现在由AI系统提供。

第三，对AI安全的启示。当多个AI Agent开始自主互动时，理解它们的行为模式变得越来越重要。这不仅是防止恶意Agent的问题，也是确保多Agent系统能够高效协作的基础。如果一个多Agent系统中不同Agent的决策逻辑相互冲突但又无法相互理解，整个系统的效率会受到严重影响。这个研究与可解释性 literature 里关于understanding agent cognition的讨论是相通的——理解Agent怎么决策，和理解人类怎么决策，在方法论上有越来越多的交叉。

第四，对LLM研究社区的启示。LLM-as-Observer的思路揭示了一个比论文本身更值得关注的方向：用LLM的隐藏状态作为特征，而不是让LLM直接做预测。这个思路在机器学习里有悠久的传统。当我们不知道某个复杂系统的具体运作机制时，可以用另一个模型去"感受"这个系统，然后把它的内部表征当作特征。这本质上是迁移学习在特征层面的应用——不是迁移预测能力，而是迁移理解能力。

这个方向有可能延伸到很多领域。比如，在金融交易里，能不能用一个LLM的隐藏状态来预测另一个交易系统的下单行为？在网络安全里，能不能用一个模型来预测另一个模型面对对抗样本的检测行为？在人机交互里，能不能用这个方法来预测人类用户对AI建议的接受概率？

这些问题都指向一个更大的图景：随着AI系统越来越普遍，我们越来越多地需要理解和预测AI系统的行为，而不仅仅是如何构建更强的AI系统。当AI系统开始在社会中扮演决策角色时，对AI行为的可解释性和可预测性就会变成安全和监管的核心议题。这个研究是这个大方向上一个有意思的小进步。

【更深层的意义：当AI开始做商业决策】

这篇论文研究的场景——两个AI Agent自主谈判——看起来还有些遥远。但实际上，这个场景正在以各种方式出现在真实商业世界里。

现在的AI Agent已经开始被用于自动比价采购、自动合同审查、自动客户服务。在这些场景中，AI Agent需要和其他系统——可能是人的系统，也可能是其他AI Agent的系统——进行复杂的决策互动。这些互动的质量，直接取决于Agent对对方行为的预测能力。一个能够准确预测供应商报价策略的采购Agent，意味着更低的采购成本；一个能够准确预测客户接受概率的报价Agent，意味着更高的成单率；一个能够准确预测对手底线的谈判Agent，意味着更好的交易结果。

这些都是真实的商业价值，也是为什么这类研究正在吸引越来越多的关注。当AI开始进入高价值决策领域时，理解AI怎么做决策、理解AI的对手怎么决策，就变得和制造AI本身一样重要了。

2026年，AI Agent正在走出实验室，走向真实的商业场景。而理解Agent行为——尤其是理解那些你不完全知道的Agent的行为——正在变成一个越来越核心的技术问题。这篇论文提供了一个解题思路，但真正的挑战还在前面：如何在更复杂、更开放、更少历史数据的真实场景里，让AI Agent能够可靠地理解和预测彼此的行为。这个问题的答案，会决定AI Agent最终能在商业世界里走多远。