
━━━━━━━━━━━━━━━━━━━━━━━━━
当两个AI Agent开始在没有任何人类介入的情况下自主谈判,一个买家机器人和一个卖家机器人来回出价,它们的对话会发生什么?一方会用什么策略来最大化自己的利益?另一方会如何回应?当一方改变了策略,另一方能否察觉并随之调整?
这个问题在几年听起来还像科幻,但2026年的AI研究者已经开始认真研究它了。在arXiv最新发表的论文《Predicting Decisions of AI Agents from Limited Interaction through Text-Tabular Modeling》中,研究者提出了一个非常具体但又极具普遍意义的问题:当一个AI Agent面对一个它完全不熟悉的交易对手时,能不能只通过几轮对话和互动历史,预测对方下一步会做什么?
这个问题听起来抽象,但它有非常直接的现实意义。当AI Agent开始进入电子商务自动采购、合同条款谈判、服务级别协议制定这些场景时,它们之间的互动会越来越频繁。而这些互动里有一个根本性的信息不对称:每个Agent的内部逻辑——用了什么LLM、什么提示词工程、什么控制规则、什么回退策略——对对方来说都是黑箱。但每一个决策,都可能带来真实的货币后果。一次错误的接受报价可能导致采购成本虚高,一次失策的还价可能导致供应商放弃谈判。对于部署这些Agent的企业来说,能预测对手行为的Agent就是有竞争优势的Agent。
【它研究的核心问题是什么】
这篇论文研究的核心问题叫做目标适应型文本表格预测(target-adaptive text-tabular prediction),这个名字听起来很技术,但它描述的场景其实很直观。
具体来说,场景是这样的:在受控的议价和谈判游戏里,一个Agent需要预测另一个完全不熟悉的Agent的下一步决策。每次决策点构成一行数据,结合了三个层面的信息:结构化的游戏状态特征(比如当前是第几轮、双方的初始出价是多少、之前双方各自报价的历史轨迹)、历史报价的数值序列,以及对话的文本内容。研究提供的条件是K轮与同一个目标Agent互动过的历史对话,这些对话都附带了标注——即每轮最终做的是什么决策。
模型的输入格式是表格化的,但其中包含了大量的非结构化文本。这种混合形态在真实世界里其实很常见:商业决策既涉及数值指标,也涉及语言表达。论文的创新点在于它对这种混合形态的处理方式。
这里最关键的一个创新叫LLM-as-Observer。这个概念需要仔细理解,因为它和我们平时对LLM的使用方式非常不同。我们通常把LLM当作一个直接预测器:你问它一个问题,它给出一个回答,这个回答就是预测结果。但在LLM-as-Observer的框架里,一个小型的冻结LLM被用来读取决策时的状态和对话内容,它的回答本身被直接丢弃——注意,这里不是让LLM做预测后忽略预测结果,而是让LLM产生回答,然后丢弃回答本身,只保留它的隐藏状态(hidden states)。
为什么要这样做?因为LLM在处理和回答一个问题时,它的内部激活模式会包含远比最终回答更丰富的信息。这些激活模式本质上是对输入的一种深度编码,捕捉了LLM在理解当前状态时用到的各种抽象特征。把这些隐藏状态当作特征向量来使用,相当于把一个训练好的大语言模型当作一个强大的特征提取器,但它不是在做预测任务,而是在做理解任务。这两者之间的区别非常关键:直接预测时,LLM需要根据few-shot示例直接输出判断结果;而作为Observer时,LLM在学习理解对手的决策模式,这个任务更接近于对行为规律的归纳,而不是对话风格的模仿。
【为什么这在商业上有价值】
理解这个研究为什么有价值,需要先理解AI Agent在现实商业场景里遇到的具体问题。
考虑一个实际发生中的商业场景。某家电商平台开始用AI Agent帮商家自动谈判批发价格。平台方的Agent需要和大量不知名的供应商Agent互动——这些供应商的Agent用了什么LLM、什么提示词、什么控制逻辑,平台方完全不知道,也不可能知道。但它必须做出决策:是接受当前报价,还是继续还价,还是直接放弃这个供应商转向下一个。每一个决策都涉及真实的金钱:接受一个虚高的价格意味着采购成本上升,还价太激进可能导致供应商流失,还价太保守则可能错过更好的交易机会。
在传统的Few-shot Prompting框架下,平台方的Agent可以给历史上见过的供应商Agent对话作为示例,让它推测当前供应商的行为。但这有一个根本缺陷:few-shot预测依赖示例的质量和数量。当当前供应商的行为模式超出示例范围时,预测就会失效。而且,直接让一个LLM通过对话内容预测对方决策,实际上是在让LLM扮演一个人类角色——它需要根据有限的例子推断对手的策略和偏好——而不是在学习理解对手的系统性决策规律。这是一个更难的学习任务,需要更多的示例才能做好。
LLM-as-Observer的方法绕过了这个问题。它不是让一个LLM去模拟另一个LLM的行为输出,而是利用冻结LLM的隐藏状态来提取决策相关的信号。本质上,这是一个特征工程问题,只不过特征来自LLM的内部表征,而不是人工设计的规则或统计特征。这和深度学习在计算机视觉领域的历程很像:早期人们手工设计特征(边缘、纹理、形状描述子),后来发现深度网络能够从数据中自动学习更好的特征表示。现在,同样的逻辑正在迁移到AI Agent行为建模领域。
【实验结果说明了什么】
研究者在13个前沿LLM Agent上进行训练,然后在91个保留的scaffolded Agent上进行测试。这个跨度的测试设计很重要:scaffolded Agent是用规则、提示词和控制逻辑构建的代理,而非直接的LLM调用。这意味着测试的对手在行为模式上是多样化的,并非都来自同一个基础模型的不同配置。这种设定更接近真实世界的情况:真实的商业对手可能运行着完全不同的系统,有着完全不同的行为特征。
结果显示,在K=16(即提供16轮历史交互作为示例)的情况下,使用Observer特征的完整模型比直接LLM-as-Predictor prompting和游戏加文本特征基线方法的响应预测AUC高约4个百分点,议价报价预测误差降低14%。
这些数字在机器学习领域里听起来不算巨大的幅度,但需要考虑实验条件的高难度:对手是多样化的、未知的,预测窗口只有几轮历史。4个点的AUC提升意味着在所有其他条件相同的情况下,这个模型能更准确地判断"对方会接受还是拒绝当前报价"。14%的预测误差降低则意味着报价预测的平均偏差缩小了将近七分之一。对于一个自动采购系统来说,如果能够更准确地预测供应商的报价策略,它就能制定更好的还价策略,或者判断什么时候应该停止谈判、接受当前报价。这个能力在竞争激烈的采购场景里是可以转化为真实利润的。
值得注意的是Observer特征在实验中的贡献。研究者做了消融实验,对比了有Observer特征和没有Observer特征两种条件下的模型表现。结果显示,Observer特征在两个任务上都有正向贡献,而且这个贡献与游戏状态特征和对话特征是正交的——也就是说,它提供的是额外的信息,而不是重复的信息。这印证了LLM-as-Observer这个思路的有效性:冻结的大语言模型确实捕捉到了决策相关的信号,而这些信号在直接的few-shot prompting中是无法被利用的。
【从研究到实践的路径】
这个研究目前还停留在受控实验阶段,真实商业场景的复杂度远超论文中的谈判游戏。但它的方向有几个值得注意的实践含义。
第一,对AI Agent开发者的启示。当你的Agent需要和其他不透明的Agent互动时,最可靠的不是让模型直接猜测对方行为——尤其是在对方的行为空间很大、历史示例很少的情况下。更可靠的方式是通过某种方式提取对方决策模式里的一致性规律。这可能意味着需要更多的可观测性工具,或者行业范围内标准化Agent行为描述格式的讨论。在多Agent系统越来越普遍的将来,"如何理解你不知道内部逻辑的对手"这个问题会变得越来越重要。
第二,对企业部署AI Agent的启示。越来越多的企业开始考虑用多Agent系统来自动化商业流程。在这种架构里,不同的Agent可能属于不同的供应商、不同的业务线,甚至完全不同的公司。如果系统能够通过观察历史交互来预测其他Agent的行为,这相当于在系统层面多了一层博弈分析能力。这对自动采购、合同谈判、争议解决等场景都有直接价值。想象一个谈判Agent能够根据对手的历史出价模式,判断当前报价是否处于合理区间,以及继续还价的期望收益是否足够大。这个能力在以前需要专业的谈判专家才能提供,现在由AI系统提供。
第三,对AI安全的启示。当多个AI Agent开始自主互动时,理解它们的行为模式变得越来越重要。这不仅是防止恶意Agent的问题,也是确保多Agent系统能够高效协作的基础。如果一个多Agent系统中不同Agent的决策逻辑相互冲突但又无法相互理解,整个系统的效率会受到严重影响。这个研究与可解释性 literature 里关于understanding agent cognition的讨论是相通的——理解Agent怎么决策,和理解人类怎么决策,在方法论上有越来越多的交叉。
第四,对LLM研究社区的启示。LLM-as-Observer的思路揭示了一个比论文本身更值得关注的方向:用LLM的隐藏状态作为特征,而不是让LLM直接做预测。这个思路在机器学习里有悠久的传统。当我们不知道某个复杂系统的具体运作机制时,可以用另一个模型去"感受"这个系统,然后把它的内部表征当作特征。这本质上是迁移学习在特征层面的应用——不是迁移预测能力,而是迁移理解能力。
这个方向有可能延伸到很多领域。比如,在金融交易里,能不能用一个LLM的隐藏状态来预测另一个交易系统的下单行为?在网络安全里,能不能用一个模型来预测另一个模型面对对抗样本的检测行为?在人机交互里,能不能用这个方法来预测人类用户对AI建议的接受概率?
这些问题都指向一个更大的图景:随着AI系统越来越普遍,我们越来越多地需要理解和预测AI系统的行为,而不仅仅是如何构建更强的AI系统。当AI系统开始在社会中扮演决策角色时,对AI行为的可解释性和可预测性就会变成安全和监管的核心议题。这个研究是这个大方向上一个有意思的小进步。
【更深层的意义:当AI开始做商业决策】
这篇论文研究的场景——两个AI Agent自主谈判——看起来还有些遥远。但实际上,这个场景正在以各种方式出现在真实商业世界里。
现在的AI Agent已经开始被用于自动比价采购、自动合同审查、自动客户服务。在这些场景中,AI Agent需要和其他系统——可能是人的系统,也可能是其他AI Agent的系统——进行复杂的决策互动。这些互动的质量,直接取决于Agent对对方行为的预测能力。一个能够准确预测供应商报价策略的采购Agent,意味着更低的采购成本;一个能够准确预测客户接受概率的报价Agent,意味着更高的成单率;一个能够准确预测对手底线的谈判Agent,意味着更好的交易结果。
这些都是真实的商业价值,也是为什么这类研究正在吸引越来越多的关注。当AI开始进入高价值决策领域时,理解AI怎么做决策、理解AI的对手怎么决策,就变得和制造AI本身一样重要了。
2026年,AI Agent正在走出实验室,走向真实的商业场景。而理解Agent行为——尤其是理解那些你不完全知道的Agent的行为——正在变成一个越来越核心的技术问题。这篇论文提供了一个解题思路,但真正的挑战还在前面:如何在更复杂、更开放、更少历史数据的真实场景里,让AI Agent能够可靠地理解和预测彼此的行为。这个问题的答案,会决定AI Agent最终能在商业世界里走多远。
夜雨聆风