用AI写公司深度研报——全流程复盘与方法论总结
前言
这两天(准确说是几个小时前到现在…),我做了一个实验:用AI(Kimi/WorkBuddy)辅助完成一篇A股公司深度研报。从项目搭建、资料阅读、大纲拟定、初版撰写到完整报告输出,整个流程走了一遍。这篇复盘记录的不是某家公司的投资价值,而是 “AI如何嵌入卖方研报生产流程” 的方法论探索。如果你也是投研从业者,或许能从中找到一些可复用的思路。
一、为什么要做这件事
券商研究所的日常工作里,深度报告是核心产出,但也是时间黑洞。一篇30-40页的深度报告,传统流程通常需要:
-
阅读数十份资料(年报、季报、调研纪要、参考研报) -
整理数据、制作图表、搭建财务模型 -
反复修改结构、措辞、格式 -
最后对齐公司模板,调整页眉页脚、免责声明
整个过程动辄一周甚至更久。我一直在想:哪些环节可以被AI提效?哪些环节必须人工把关?AI和分析师的最佳协作界面在哪里?
带着这些问题,我搭建了一个专门用于”AI辅助研报撰写”的项目框架,以某新能源汽车龙头公司为样本,跑通了全流程。
二、项目架构设计:让AI有章可循
要让AI有效地辅助写研报,首先要解决一个基础问题:资料和输出的秩序。如果AI每次都要问”文件在哪里”,效率就大打折扣。
2.1 文件夹结构
我设计了四层文件夹结构:
公司深度撰写项目/
├── 01_参考资料/
│ ├── 01_研报撰写规则及指导/ ← 质控合规规则、撰写培训材料
│ ├── 02_参考研报/ ← 友商同类深度报告
│ ├── 03_公司定期报告/ ← 季报、年报、半年报
│ ├── 04_公司调研纪要/ ← 调研纪要、业绩说明会
│ ├── 05_公司销量数据/ ← 月度/季度销量、分车型数据
│ └── 06_公司其他参考资料/ ← 公告、ESG、新闻、公众号文章等
├── 02_格式模板/ ← 公司研报 Word 模板
├── 03_研报工作区/
│ ├── 01_提纲与讨论/ ← 大纲初稿及讨论记录
│ ├── 02_初版简报/ ← 简化版初步研报
│ └── 03_完整报告/ ← 完整版 Markdown 草稿
└── 04_最终输出/ ← Markdown 定稿 + Word 终稿
这个结构的核心逻辑是:左边输入(参考资料),中间加工(工作区),右边输出(终稿)。AI知道自己的”阅读范围”和”写作范围”,不会乱写文件。
2.2 资料清单机制
我要求AI维护一份资料清单,每份文件标注:
-
文件名、格式、页数、核心内容 -
阅读状态(已读/待读) -
数据缺口(哪些数据这份资料里没有)
这个机制的好处是:后续新增资料时,AI能秒级定位,不用反复翻目录。对于经常需要更新数据的研报项目,这是一个必要的”索引层”。
2.3 时间敏感检查清单
研报最怕数据过时。我建立了一个检查清单,每次进入新阶段前,AI主动确认:
-
股价/市值/估值是否最新? -
最新月度/季度销量出了吗? -
行业政策有变化吗? -
竞争对手有什么新动态?
这个机制强制AI在动笔前”刷新”数据,避免用两个月前的销量数据写报告。
三、三阶段工作法:大纲 → 初版 → 完整版
我坚持的流程是三阶段递进,每个阶段都是”先输出、再讨论、后迭代”。这个节奏很关键——它避免了”写完全文才发现结构有问题”的灾难。
3.1 阶段一:拟定大纲(最关键的一步)
大纲阶段的核心任务不是写内容,而是确立视角和结构。
我放了10份参考研报、4份撰写规则文件、1份年报、5份调研纪要给AI。AI的阅读顺序是:
-
先读规则——了解合规要求、评级规范、免责声明格式 -
再读参考研报——学习友商的结构、视角、论证方式 -
最后读公司资料——提取基本面数据、管理层表述、战略方向
在消化这些资料后,AI提出了一份大纲。这里有个关键点:大纲必须有差异化视角。如果大纲只是”公司介绍+财务分析+估值”的流水账,那这篇报告就没有存在的意义。
最终我们定稿的大纲六章结构是:公司概览 → 技术护城河 → 全球化 → 高端化 → 业务拆分与财务分析 → 风险提示。整个讨论过程中,用户(我)对大纲做了两次结构性调整(合并章节、简化风险提示),AI根据反馈即时修改。
经验:大纲讨论得越充分,后续返工越少。这次大纲阶段大约占整个项目30%的时间,但避免了完整版阶段的结构性重写。
3.2 阶段二:初版简报(验证逻辑)
初版简报是一份结构完整但内容精炼的版本,每章只写核心论点和关键数据,篇幅控制在5-8页。
这个阶段的目的有三个:
-
验证大纲的逻辑是否自洽 -
确认数据假设是否合理(销量、毛利率、费用率等) -
确定估值框架(我们用SOTP分部估值)
初版简报写完后,我要求AI补充了实时数据:
-
股价、市值、PE/PB -
可比公司估值(宁德时代、特斯拉、理想等) -
最新销量数据
这些数据通过ifind/NeoData金融数据接口自动获取,不需要手动查。AI将数据填入简报后,SOTP估值框架就有了初步轮廓。
3.3 阶段三:完整版报告(扩充深度)
完整版的核心任务是:在初版骨架上填充肌肉。
这个阶段AI做了几件事:
-
每章展开为3-5个小节,补充论据和数据 -
插入12张表格(业务对比、财务指标、估值框架等) -
用文字描述6幅图表的呈现方式(因为当前AI绘图能力有限,复杂图表先占位) -
数据空缺处标注**[待补充]**,不编造数据
完整版输出为Markdown格式,便于我快速审阅和修改。
四、资料处理:PDF是最大痛点
在实际操作中,资料读取是最消耗时间的环节之一。
4.1 PDF处理的现实
我存放的参考资料里,24份是PDF格式(年报、研报、规则文件)。AI直接读取PDF时,发现很多是扫描型/图片型文档,无法直接提取文字。最终我们用了Python的pypdf库批量提取文本,但有几个问题:
-
表格会变成纯文本,列错位严重,需要人工校对 -
复杂排版会乱序,图表标题和正文可能混到一起 -
扫描型PDF完全无法读取,需要OCR,速度慢且中文识别准确率不稳定
4.2 最优方案总结
经过实测,我的建议是:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
核心结论:PDF AI能处理,但如果你有同一资料的Word/Excel版本,优先给那个。
五、数据获取:AI的金融数据接口怎么用
写研报离不开实时数据。这次我们用了ifind/NeoData金融数据接口,覆盖:
-
个股数据:股价、市值、PE/PB/PS、ROE、股息率 -
财务数据:营业收入、归母净利润、毛利率、费用率(历史5年) -
可比公司:宁德时代、特斯拉、理想、蔚来、小鹏、阳光电源的估值数据 -
行业数据:新能源汽车销量、渗透率、出口数据
数据获取是自然语言查询——直接说”查一下比亚迪最新股价和PE”,AI自动识别需要的API并返回结果。这比手动打开ifind或Wind一个个点要快得多。
但有几个注意事项:
-
数据接口覆盖不全:有些细分数据(比如比亚迪各品牌分车型销量)接口里没有,需要手动补充 -
销量数据口径不一:公司公告、中汽协、乘联会的数据可能有差异,需要注明来源 -
时间戳很重要:所有数据必须标注截止日期,否则下次更新时不知道哪些数据过期了
六、写作过程:卖方语言不是”说人话”
6.1 什么是卖方语言
卖方研报有一套自己的话语体系。我要求AI参考了10份友商研报后,总结了几个特点:
-
观点前置:每章开头先给核心结论,再展开论证 -
数据驱动:每个观点必须有数据支撑,”我们认为”后面要跟数字 -
格式规范:投资案件五要素(评级/假设/差异化认知/催化剂/风险)、表格化呈现 -
术语统一:同比增速、环比、百分点(pct)、对应PE、维持评级等 -
风险提示量化:尽量定量分析风险对业绩的影响,而不是泛泛而谈
6.2 AI的适配过程
第一次输出的文本偏”说明文”,经过明确要求”用卖方研报语言重写”后,AI的输出质量明显提升。关键指令包括:
-
“每章开头给核心结论” -
“用’我们认为’引导观点” -
“表格化呈现对比数据” -
“避免口语化表达”
6.3 图表处理
这次报告里,AI实现了12张Markdown表格,但6幅复杂图表(趋势图、循环图、阶梯图等)只能先用文字描述占位,标注”【柱状图+时间轴】展示…”
当前AI生成专业投研图表的能力还有限。我的做法是:
-
简单数据对比 → AI直接做表格 -
复杂趋势图/结构图 → AI写文字描述,分析师用Excel/Python做好后插入 -
需要视觉设计的信息图 → 暂时跳过,或留到PPT版本再做
七、输出交付:Markdown → Word 转换
7.1 为什么先写Markdown
Markdown是AI最擅长的结构化文本格式。先输出Markdown的好处:
-
审阅速度快,不用等Word打开 -
修改成本低,直接编辑文本 -
版本控制方便,diff一目了然
7.2 Word转换的技术实现
定稿后,我用Python的python-docx库将Markdown转换为Word,格式参数完全匹配公司模板:
-
A4纸、窄边距(上1.5cm/下1.0cm/左右1.6cm) -
正文宋体10.5pt,标题黑体(一级18pt、二级14pt、三级12pt) -
表格首行浅蓝底+黑体,内容宋体 -
引用块楷体灰色字
这个转换脚本是可复用的——下一篇报告只需要替换Markdown源文件,就能自动生成匹配模板格式的Word。
八、经验教训:哪些做得好,哪些需要优化
8.1 做得好的地方
(1)三阶段递进节奏合理
大纲→初版→完整版,每个阶段都有明确的交付物和确认节点。没有出现”写完全文再推翻重来”的情况。
(2)资料管理前置
文件夹结构+资料清单+时间敏感检查清单,这三件套让AI在整个过程中没有”迷路”。即使对话跨了两天,AI通过读取工作记忆文件就能秒级恢复上下文。
(3)数据获取自动化
股价、估值、可比公司数据、行业销量数据都通过接口自动获取,节省了大量手动查数据的时间。
(4)不编造数据
所有不确定的数据都标注[待补充],没有为了报告好看而编造数字。这是合规底线。
8.2 需要优化的地方
(1)PDF读取仍是瓶颈
24个PDF需要批量提取+人工校对,如果未来所有资料都能提供可复制文字版或Excel,效率会大幅提升。
(2)图表生成能力有限
复杂图表需要人工后处理。如果AI能直接生成高质量的投研图表(带正确配色、字体、标注),产出效率还能再上一个台阶。
(3)财务模型搭建仍需人工
SOTP估值的净利润拆分、敏感性分析等,AI只能做框架性估算,精确模型仍需分析师在Excel中搭建。这是AI目前无法替代的核心环节。
(4)反馈机制可以更系统化
虽然每次提交成果时AI都给了反馈引导,但如果能固化为更结构化的”审阅清单”(比如每阶段必查的10个问题),审阅效率会更高。
九、工具链总结
整个流程中用到的工具和能力:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
十、核心结论:AI在研报生产中的定位
跑完这一整轮流程后,我对”AI能做什么、不能做什么”有了更清晰的认识:
AI擅长的是:
-
资料阅读与信息提取(尤其是文字型资料) -
结构化写作(按大纲填充内容、生成表格) -
数据查询与整理(实时数据、可比公司数据) -
格式转换(Markdown → Word模板)
AI不擅长的是:
-
判断什么视角是”差异化的”(需要分析师的行业认知) -
精确财务建模(需要Excel功底和对业务的深度理解) -
合规把关(评级规范、利益冲突、免责声明) -
复杂图表设计与制作
最佳协作模式:
分析师做”导演”,AI做”执行团队”
分析师负责确立视角、把关逻辑、校验数据、最终定稿;AI负责资料阅读、初稿撰写、数据查询、格式排版。这样分工,一篇深度报告的生产时间有望从一周压缩到2-3天,且质量不会因为提速而下降。
附录:给想尝试的同行的建议
如果你也想用AI辅助写研报,建议按以下顺序启动:
-
先搭框架:设计好文件夹结构和协作流程,这比急着写内容更重要 -
规则前置:把公司研报模板、合规要求先放进去,让AI从第一天就知道”边界” -
从大纲开始:不要跳过大纲阶段,这是整篇报告的”设计图” -
数据标注来源:所有数据必须可追溯,底稿核查时要有据可查 -
人工最终把关:AI写的报告必须经过分析师审阅,尤其是评级、目标价、核心假设
本文仅为工作流程复盘,不涉及任何个股的投资建议或估值分析。
复盘日期:2026年4月25日
夜雨聆风