
+
目录
一、大模型Agent重塑主动投研体系
1.1 赋能主动权益:动态捕捉行业核心逻辑
1.2 增强量化策略效能:向细分特殊化Beta方向演进
1.3 推理类模型已成主流,COT成为提升输出质量的核心
二、主观投资框架提取工作流
2.1 工作流设计及主观投资思维链提取
2.2 主观投资思维链验证
2.3 优质主观投资CoT联合选股策略
2.3.1多投资专家联合投票策略
2.3.2 主观投资CoT加权选股策略
三、行业投资框架构建与个股投资顾问Agent
3.1 行业投资框架梳理与精选
3.2 个股投资顾问Agent
四、总结与展望
风险提示
摘要
■ 投资逻辑
寻找复杂轮动市场下的核心定价逻辑
在当前的A股市场环境下,行业轮动速度显著加快,把握一个行业特质性的投资选股逻辑已经成为获取结构性超额收益的关键。然而,传统的投研模式正面临着“覆盖广度”与“响应速度”的双重挑战:一方面,个人分析师的精力有限,难以实时、深度覆盖数百只个股及快速涌现的新兴赛道;另一方面,传统的量化多因子模型难以真正理解非结构化研报文本背后复杂的“因果推演逻辑”。为此,本报告通过引入大模型思维链(CoT)技术,试图实现自动化提取并时序跟踪行业分析师的投研逻辑,动态捕捉行业定价最核心的逻辑,为投资决策提供差异化的逻辑补充,以此深度赋能主动权益投资。
工作流设计:投资思维链的动态提取与验证
本报告构建了一套端到端的投资思维链动态生成与优选机制。通过大模型从海量研报中分组自动化提取、合并、更新“核心驱动要素传导路径投资结论”的完整逻辑链条,随后创新性地引入滚动单链回测机制,对提取的逻辑进行历史数据的定量测试,动态验证每一条逻辑在当前市场环境下的有效性,剔除失效逻辑,保留在当前市场环境下具备显著定价能力的“优质思维链组”。
优质CoT联合选股策略
考虑到研报信息通常较为滞后的特点,仅依据时点研报信息作为个股分析依据时效性较弱。因此在选股策略上,我们进一步加入了实时新闻信息,每条思维链会对每个截面上每只个股的汇总信息进行符合程度的判断,进而形成持仓决定、生成测试结果。基于思维链滚动测试结果,我们主要参考信息比率表现筛选优质思维链,由每个测试单位筛选出的TOP1/3优质思维链在下个测试单位各自选出满足符合条件的个股,构建了优质CoT联合投票策略与加权选股策略。
回测数据显示(2021-2026),多思维链联合投票策略相较于分析师等权基准实现了17.16%的年化超额收益,信息比率达0.48,显著优于无CoT框架的基准模型及行业基准指数。加权策略通过引入信息比率赋权,进一步提升了策略在市场下行区间的风险控制能力,信息比达0.51。
投研框架与个股智能助理
在上述测试机制的基础上,我们将碎片化的分析逻辑脱水重构,生成了一套逻辑连贯、具有阅读侧重点的行业投研框架总结。此外,我们进一步开发了个股投研顾问Agent,它能够根据最新信息,输出“看涨/中性/看跌”的诊断判断及核心分析理由,直接辅助主动投资者的日常个股决策。
风险提示
1、以上结果通过申万一级行业分类医药生物历史数据统计、建模和测算完成,若历史数据产生环境发生变化,可能出现模型失效风险;
2、策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损;
3、大模型输出的结果具有一定的随机性和幻觉风险,仅供参考。
正文
一、大模型Agent重塑主动投研体系
1.1 赋能主动权益:动态捕捉行业核心逻辑
近期OpenClaw的走红引发了主动投研领域的思考:如何驱动AI跨越简单的信息归纳,实现模拟人类专家的深度推理?其核心目标在于引导模型穿透表象数据,触达行业的底层逻辑与驱动因素,从而生成具备实战决策深度的投资洞见。
在此前的《大模型赋能投研之十三:基于海外投资大师智能体构建A股挖票框架》中,我们模拟已知的数位海外投资大师的投资逻辑,通过定量指标计算与大模型定性分析判断,生成股票投资诊断结果与交易信号,构造了全A市场下的选股Agent。而在当前的A股市场环境下,行业轮动速度显著加快,新兴概念与细分赛道层出不穷。尽管通用的研究范式仍具基础价值,但把握一个行业特质性的投资选股逻辑已经成为获取结构性超额收益的关键。
同时,在实际应用的过程中,传统的投研模式正面临着“覆盖广度”与“响应速度”的双重挑战。一方面,个人分析师的精力有限,难以对热点行业的数百只个股及快速涌现的新兴赛道(如卫星、脑机接口、AI应用等)进行实时、深度的逻辑覆盖;另一方面,传统的量化多因子模型虽然擅长处理结构化数据(如价量、财务指标),但在处理研报、纪要等非结构化文本时,往往局限于情感打分或关键词提取,难以真正理解文本背后复杂的 “因果推演逻辑”。
这种“信息-逻辑”的缺口导致了一个核心矛盾:市场定价的核心矛盾往往隐藏在复杂的产业链传导逻辑中,而传统的量化手段难以捕捉这种主观逻辑链条。尤其是在DeepSeek-R1等推理类大模型出现之前,AI模型更倾向于“概率性生成”而非“逻辑性推理”,导致输出的投资建议往往缺乏严密的推导过程和纠错能力,难以直接应用于严肃的投资决策。
本篇,我们设计的投研框架提取流程有三个主要特点:1、对非结构化的文本数据做了仔细的时序处理,每个时点生成的投研框架仅包含过去数据,屏蔽未来信息;2、将大模型的提取及加工过程可视化,并且可以人为参与框架的定制,以达到加强框架有效性的目的。3、通过接入公开市场数据对框架有效性进行验证,动态捕捉行业核心逻辑。因此,我们在实现Agent自动化提取并时序跟踪行业分析师的投研逻辑的同时,通过设计投资逻辑单链回测机制,动态捕捉行业定价最核心的逻辑,试图启发投资人捕捉市场未被覆盖的alpha机会,也为投资决策提供差异化的逻辑补充,以此赋能主动权益。
1.2 增强量化策略效能:向细分特殊化Beta方向演进
投研思维链的自动化提取与转化是大模型对量化策略的深度赋能。它不仅极大地丰富了量化库的维度——使其从单一的“因子驱动”转向“逻辑驱动”,更深刻地改变了主动投资与量化投资的范式。量化交易正从单纯的“指标刻画市场”,进化为对“深层逻辑”的语义理解与系统执行。
更具体地,在传统的量化指增产品中,核心目标往往是在严格约束行业与风格敞口的前提下挖掘纯粹的选股Alpha。然而,随着量化赛道拥挤度的提升,基于量价与传统基本面的Alpha因子出现显著的收益衰减与周期性失效。2024年以来,A股市场的结构性分化加剧。Wind数据显示,申万一级行业间的年度收益极差于2025年显著扩大,细分概念(如商业航天、AI应用等)的轮动速度逐渐以周为单位。

在此背景下,部分主动量化策略正逐步向“细分特殊化Beta”方向演进,通过将行业分析师的深度逻辑引入量化模型,构建基于产业链逻辑而非单纯统计规律的风格暴露,在挖掘到近期有效的投资逻辑后,在已有量化模型中加入主动逻辑。
1.3 推理类模型已成主流,COT成为提升输出质量的核心
2024年底至2025年,以DeepSeek-R1、OpenAI o1为代表的推理类模型(Reasoning Models)迅速崛起。数据显示,在短短一年内,推理类模型在总Token消耗中的占比已飙升至60%以上。

这一变革的核心在于思维链(Chain of Thought, CoT)技术的成熟。不同于传统模型直接给出预测结果,CoT技术赋予了模型“慢思考”的能力,它通过增加推理步骤,赋予了模型更严密的逻辑链条和纠错能力,使得模型在处理复杂金融分析和逻辑推演时,结果的准确性与深度得到了阶跃式提升。
目前,CoT已成为提升输出质量的核心驱动力。我们将其作为实现行业核心逻辑提取更新与框架整合的重要介质,设计了全新的工作流。
二、主观投资框架提取工作流
本报告选取医药生物(一级行业)作为典型案例,旨在全流程展示AI Agent的逻辑提取能力与策略实战效果。底层数据源于卖方研报这一公开的分析师投研智慧精华,我们通过构建自动化框架,深度穿透分析师的历史投资逻辑,并对其进行特色的量化验证,最终提炼出在时间序列上最具实效性的核心投资逻辑链。在后续的实践中,我们将推动Agent向二级行业及更微观的子赛道深度下沉, 使投研逻辑不仅停留在行业通识层面,更能精准映射到具体赛道的价值挖掘中。
2.1 工作流设计及主观投资思维链提取
所有研报内容将在研报筛选器中进行特定行业(≥一级)分类以及多维度质量加权(研报长度、权威分析师团队等)的筛选;随后进入思维链组处理器进行投资逻辑链组的生成、合并及更新,得到半年频的行业投研全思维链组的时间序列。
在第一层的全思维链组时间序列的基础上,我们加入全部研报信息及新闻数据,得到每组思维链单独滚动回测的全部结果,将其作为输入一起进入投研框架生成器,总结得到完整性、可读性强的同时具有侧重的完整行业投研框架;此外,我们依据框架设计个股投研顾问,形成对个股走势具有判断力和思考力的AI Agent。
全流程所使用的大模型均视计算复杂程度调用deepseek-r1及deepseek-distill-32b(量化版)。


2.2 主观投资思维链验证
在两层工作流之间,我们加入滚动半年频单链回测机制,试图实时筛选出当下最有效的优质投研逻辑进行展示并应用于选股,同时假设投资逻辑动量存在,将其应用于下个半年的个股判断。
考虑到研报信息通常较为滞后,仅依据时点研报信息作为个股分析依据时效性较弱。因此在后续的单链测试及选股策略上,我们进一步加入了实时新闻信息,每条思维链会对每个截面上每只个股的汇总信息(研报+新闻)进行符合程度的判断,进而形成持仓决定、生成测试结果。
单链测试机制上,我们在相应时序上对每只个股的月度信息进行每条单链符合程度的判断(不符合/较符合/完全符合)及置信程度(0%-100%)打分,根据阈值筛选得到时序上每条单链的符合个股持仓(0-12只),得到相对于基准(医药全指)的年化超额收益率、跟踪误差、信息比率等结果。半年频的测试结果往往波动较大但切换灵活,适用于选股策略的构建;而年频的测试结果则更加稳定,用于作为最终投研框架生成的输入部分之一。

可见在同一时间截面上,即使由大模型判断文字信号强度达标,但在实际选股过程中,不同思维链展现出截然不同的选股效果。而在不同时间截面上,同一/相近投资思维链也面临短暂/永久失效的风险,因此单一思维链难以给出稳定的有效信号。


2.3 优质主观投资CoT 联合选股策略
而根据对应时段的 CoT组测试结果,我们通过动态筛选出最有效的投资逻辑单链并进行下
个时段的联合选股,形成了优质投资思维链联合选股策略。

从大模型依据每条单独的投资思维链对个股月度信息进行符合程度判断的结果来看,被判定为“完全符合”的个股数平均仅占4.13%,判定为“不符合”的个股占44.75%,我们保证了持仓所有“完全符合”的个股的同时,剔除所有“不符合”的个股,中间“较符合”的个股依据置信程度打分排序,根据阈值决定每月持仓。


在筛选优质思维链的过程中,我们主要参考信息比率表现,选出TOP1/3的思维链最多约7条。基于测试结果,我们发现部分月份/时段存在该时间段内不存在或仅存在少量有效选股逻辑,以致当月持仓为空的情况,主要由该时段行业不景气及分析师研报覆盖度不高造成。因此,空持仓月份我们不进行调仓,保持前月选出的优质标的持仓。
2.3.1多投资专家联合投票策略
基于以上机制构建等权投票策略,每个截面筛选出的最多7条优质思维链可作为7个投资专家,拥有相同的投票权利,各自选出满足符合条件的个股。回测时间段为近5年:2021年1月-2026年1月,首个半年用于有效思维连筛选,下月月初调仓,因而首个持仓日应为2021年8月2日,费率为千分之三。每条思维链判断为持仓的记为一票,最终持仓的阈值票数为3票。



除了基于月度截面的股票分布制作的分析师等权重基准以外,我们也与行业指数基准(000991.SH)进行对比:

从策略净值与超额表现来看,相比单一投资思维链选股和无CoT选股,多思维链联合选股策略的超额表现更突出且具有稳定性。受行业整体景气度下行压制,策略相较于分析师等权基准的最大回撤发生在2021H2-2022H1,这一时期市场Beta占据主导,基于研报逻辑提炼所得策略持仓的超额收益遭遇阶段性挑战。但整体而言,策略相对等权基准获得17.16%的年化超额,信息比率为0.48。可见在特定行业内,优质思维链具有良好的联合选股能力。
2.3.2 主观投资CoT加权选股策略
多思维链等权投票策略存在超额回撤较大的问题,被更多条选股逻辑选中的个股要绝对优于被少量更有效逻辑链选中的个股。为此,我们引入权重对每只被优质思维链选中的股票进行加权赋值,即思维链表现越优异,被该思维链选中的股票将获得更高的得分,最终将月度累计得分高于阈值的股票作为持仓。
由于我们的赋分权重主要来源于思维链检验期间所得的信息比率分位数构建,因而在行业景气程度不同的时段权重本身有所高低,这使得最终的个股得分天然具有两个特点:1、阈值有效性区间:只有达到一定得分阈值后,分值才具有股票间的比较筛选意义;而当阈值过高,截面股票个数不足,因子难具有绝对单调性;2、具备一定择时效果:某些时段由于行业整体不景气造成入选的优质思维链数量减少或同时满足关键CoT符合程度要求的具备优质基本面的个股数量较少,以绝对阈值做筛选将无法得到有效持仓,此时我们维持上期信号不变,把握确定信号,同时规避了盲目空仓或调仓带来的信号错配。
在和多思维链联合投票策略相同的回测区间和优质投研逻辑筛选标准下,我们构建了优质投研CoT加权选股策略,持仓阈值分数为3.5。


根据策略表现,在多个基准下的策略回撤得到更好地控制,信息比率有所提升,证明分数加权后确使策略有一定的风险规避能力。但仔细检查无持仓信号月份,并非所有月份都能精准匹配指数下行,存在部分时段因基本面逻辑大范围失效或快速轮动从而无法筛选出稳定有效的优质链的情况,是目前策略回撤的主要原因。
三、行业投资框架构建与个股投资顾问Agent
3.1 行业投资框架梳理与精选
在传统的行业研究过程中,构建完备的投研体系往往受限于海量研报的研读成本。通过引入思维链的自动化提取、迭代与二次归纳,我们能够将碎片化的分析逻辑快速脱水并重构,高效生成一套逻辑连贯、可读性极强的行业投研全景图。
在单链测试的过程中,虽然许多投资逻辑独立选股能力较差,但具有置信度补充与风险控制的意义。为了让最终的投资框架具有思维完整性的同时有阅读侧重点,我们把时序上所有CoT单链的年度测试结果组和更新的思维链组一起作为框架生成的输入,得到兼具可读性和侧重点的一系列投资框架。每个框架都按照内容将相应的思维链组归纳到相应的一级标题下,每个分点后的“建议关注程度”打分则是大模型基于所关联投资思维链的测试结果及信号强度进行综合评价打分(1-5分),以辅助理解各个细分环节的重要程度。

在全框架的基础上,我们进一步聚焦框架测试过程中被验证为最有效的核心逻辑思维链,做进一步的核心框架总结:

3.2 个股投资顾问Agent
在所生成框架的基础上,我们加入了个股相关时点上的公开研报、新闻数据,以此构建了个股诊断功能。以股票X为例,我们调用个股投研顾问agent,在随机两个不同时点对该股票在行业中的投资价值进行分析,日期分别为2024年11月和2025年7月,大模型会根据对相应信息的判断给出中性/看涨/看跌的投资判断及置信程度打分,并给出核心分析理由。

根据结果,智能体能较准确地区分涨跌信号,并主要依据框架中推荐关注程度较高的逻辑进行个股分析,因此时序的前后连贯性较强,便于对比考察。
四、总结与展望
本报告构建了一套基于大语言模型(LLM)的投资思维链(CoT)动态生成机制,通过将非线性的行业投资逻辑转化为可量化、可验证的策略信号,成功验证了AI在捕捉行业定价核心方面的潜力。这不仅为主动权益投资提供了高解释性的动态逻辑支持,也为量化策略向“基本面深度赋能”方向演进提供了新的路径。
当前的框架是我们AI赋能投研的起点。基于现有的研究成果,我们认为未来应重点围绕以下维度进行深化与拓展,以进一步提升模型的定价效率与策略的鲁棒性:
1、 目前的思维链主要基于基本面逻辑。未来我们将应用场景拓展至宏观-行业-个股的联动分析以及事件驱动策略。利用LLM强大的文本处理能力,加强对新闻资讯、社交媒体情绪等非结构化数据的实时处理。通过捕捉突发事件(如政策变化、业绩预告)对行业逻辑的瞬间冲击,实现从“静态逻辑挖掘”向“动态事件响应”的跨越,进一步丰富策略的收益来源。
2、 深化非结构化数据的因子化与多模态融合。针对大模型基于投研框架生成的非结构化个股观点,我们将引入表征学习机制。通过预训练语言模型获取个股观点的Embedding向量,并实施有效的特征降维以缓解维数灾难。处理后的低维语义向量将作为正交于传统量价因子的Alpha源,这些经过提炼的语义特征将作为区别于传统行情的增量信息,与量价数据共同被纳入机器学习选股模型的特征池中,输入至机器学习模型。通过构建“基本面逻辑表征+市场量价数据”的多模态选股框架,有效拓展因子的信息边界,提升模型在非线性市场环境下的预测效能。
3、 当前思维链多侧重于单一维度的逻辑推理。未来我们将探索更为复杂的框架合成机制,打破线性的推理模式。通过引入逻辑交集与并集的运算规则,将不同视角(如供需格局、估值修复、资金情绪)的思维链进行非线性融合。这种“多线程”的逻辑网络能够更全面地刻画市场定价机制,过滤掉单一逻辑下的噪音信号的同时,防止漏掉那些单方面极端优秀但其他方面平平的“特质型机会”,从而构建出胜率更高、回撤控制更优的复合型投资框架。
风险提示
1、以上结果通过申万一级行业分类医药生物历史数据统计、建模和测算完成,若历史数据产生环境发生变化,可能出现模型失效风险;
2、策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损;
3、大模型输出的结果具有一定的随机性和幻觉风险,仅供参考。
往期报告
主动量化系列
Alpha掘金系列
Beta猎手系列
1.《Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股》
2.《Beta猎手系列之十一:基于红利风格择时+红利股优选构建的固收+策略》
3.《Beta猎手系列之十:个股K线图形态AI识别构建市场风格预测》
5.《Beta猎手系列之八:基于偏股型转债的择时与择券构建固收+策略》
6.《Beta猎手系列之七:追上投资热点——基于LLM的产业链图谱智能化生成》
7.《Beta猎手系列之六:基于宏观量价信号叠加的微盘股茅指数择时轮动策略》
8.《Beta猎手系列之五:基于机构调研热度和广度视角的行业配置策略》
9.《Beta猎手系列之四:如何利用ChatGPT解析卖方策略观点并构建行业轮动策略?》
10.《Beta猎手系列之三:行业超预期的全方位识别与轮动策略》
11.《Beta猎手系列之二:熵池模型:如何将纯主动观点纳入量化配置模型》
12.《Beta猎手系列:基于动态宏观事件因子的股债轮动策略》
智能化选基系列
量化漫谈系列
量化掘基系列
CTA金点子系列
年度投资策略
+
报告信息

证券研究报告:《大模型赋能投研之十九:主观投资框架验证与个股决策Agent》
对外发布时间:2026年03月11日
报告发布机构:国金证券股份有限公司
证券分析师:高智威
SAC执业编号:S1130522110003
邮箱:gaozhiw@gjzq.com.cn
证券分析师:张晓冉
SAC执业编号:S1130525080008
邮箱:zhang_xiaoran@gjzq.com.cn


点击下方阅读原文,获取更多最新资讯
夜雨聆风