乐于分享
好东西不私藏

用AI写公司深度研报——全流程复盘与方法论总结

用AI写公司深度研报——全流程复盘与方法论总结

前言

这两天(准确说是几个小时前到现在…),我做了一个实验:用AI(Kimi/WorkBuddy)辅助完成一篇A股公司深度研报。从项目搭建、资料阅读、大纲拟定、初版撰写到完整报告输出,整个流程走了一遍。这篇复盘记录的不是某家公司的投资价值,而是 “AI如何嵌入卖方研报生产流程” 的方法论探索。如果你也是投研从业者,或许能从中找到一些可复用的思路。


一、为什么要做这件事

券商研究所的日常工作里,深度报告是核心产出,但也是时间黑洞。一篇30-40页的深度报告,传统流程通常需要:

  • 阅读数十份资料(年报、季报、调研纪要、参考研报)
  • 整理数据、制作图表、搭建财务模型
  • 反复修改结构、措辞、格式
  • 最后对齐公司模板,调整页眉页脚、免责声明

整个过程动辄一周甚至更久。我一直在想:哪些环节可以被AI提效?哪些环节必须人工把关?AI和分析师的最佳协作界面在哪里?

带着这些问题,我搭建了一个专门用于”AI辅助研报撰写”的项目框架,以某新能源汽车龙头公司为样本,跑通了全流程。


二、项目架构设计:让AI有章可循

要让AI有效地辅助写研报,首先要解决一个基础问题:资料和输出的秩序。如果AI每次都要问”文件在哪里”,效率就大打折扣。

2.1 文件夹结构

我设计了四层文件夹结构:

公司深度撰写项目/
├── 01_参考资料/
│   ├── 01_研报撰写规则及指导/   ← 质控合规规则、撰写培训材料
│   ├── 02_参考研报/             ← 友商同类深度报告
│   ├── 03_公司定期报告/         ← 季报、年报、半年报
│   ├── 04_公司调研纪要/         ← 调研纪要、业绩说明会
│   ├── 05_公司销量数据/         ← 月度/季度销量、分车型数据
│   └── 06_公司其他参考资料/     ← 公告、ESG、新闻、公众号文章等
├── 02_格式模板/                 ← 公司研报 Word 模板
├── 03_研报工作区/
│   ├── 01_提纲与讨论/           ← 大纲初稿及讨论记录
│   ├── 02_初版简报/             ← 简化版初步研报
│   └── 03_完整报告/             ← 完整版 Markdown 草稿
└── 04_最终输出/                 ← Markdown 定稿 + Word 终稿

这个结构的核心逻辑是:左边输入(参考资料),中间加工(工作区),右边输出(终稿)。AI知道自己的”阅读范围”和”写作范围”,不会乱写文件。

2.2 资料清单机制

我要求AI维护一份资料清单,每份文件标注:

  • 文件名、格式、页数、核心内容
  • 阅读状态(已读/待读)
  • 数据缺口(哪些数据这份资料里没有)

这个机制的好处是:后续新增资料时,AI能秒级定位,不用反复翻目录。对于经常需要更新数据的研报项目,这是一个必要的”索引层”。

2.3 时间敏感检查清单

研报最怕数据过时。我建立了一个检查清单,每次进入新阶段前,AI主动确认:

  • 股价/市值/估值是否最新?
  • 最新月度/季度销量出了吗?
  • 行业政策有变化吗?
  • 竞争对手有什么新动态?

这个机制强制AI在动笔前”刷新”数据,避免用两个月前的销量数据写报告。


三、三阶段工作法:大纲 → 初版 → 完整版

我坚持的流程是三阶段递进,每个阶段都是”先输出、再讨论、后迭代”。这个节奏很关键——它避免了”写完全文才发现结构有问题”的灾难。

3.1 阶段一:拟定大纲(最关键的一步)

大纲阶段的核心任务不是写内容,而是确立视角和结构

我放了10份参考研报、4份撰写规则文件、1份年报、5份调研纪要给AI。AI的阅读顺序是:

  1. 先读规则——了解合规要求、评级规范、免责声明格式
  2. 再读参考研报——学习友商的结构、视角、论证方式
  3. 最后读公司资料——提取基本面数据、管理层表述、战略方向

在消化这些资料后,AI提出了一份大纲。这里有个关键点:大纲必须有差异化视角。如果大纲只是”公司介绍+财务分析+估值”的流水账,那这篇报告就没有存在的意义。

最终我们定稿的大纲六章结构是:公司概览 → 技术护城河 → 全球化 → 高端化 → 业务拆分与财务分析 → 风险提示。整个讨论过程中,用户(我)对大纲做了两次结构性调整(合并章节、简化风险提示),AI根据反馈即时修改。

经验:大纲讨论得越充分,后续返工越少。这次大纲阶段大约占整个项目30%的时间,但避免了完整版阶段的结构性重写。

3.2 阶段二:初版简报(验证逻辑)

初版简报是一份结构完整但内容精炼的版本,每章只写核心论点和关键数据,篇幅控制在5-8页。

这个阶段的目的有三个:

  • 验证大纲的逻辑是否自洽
  • 确认数据假设是否合理(销量、毛利率、费用率等)
  • 确定估值框架(我们用SOTP分部估值)

初版简报写完后,我要求AI补充了实时数据:

  • 股价、市值、PE/PB
  • 可比公司估值(宁德时代、特斯拉、理想等)
  • 最新销量数据

这些数据通过ifind/NeoData金融数据接口自动获取,不需要手动查。AI将数据填入简报后,SOTP估值框架就有了初步轮廓。

3.3 阶段三:完整版报告(扩充深度)

完整版的核心任务是:在初版骨架上填充肌肉

这个阶段AI做了几件事:

  • 每章展开为3-5个小节,补充论据和数据
  • 插入12张表格(业务对比、财务指标、估值框架等)
  • 用文字描述6幅图表的呈现方式(因为当前AI绘图能力有限,复杂图表先占位)
  • 数据空缺处标注**[待补充]**,不编造数据

完整版输出为Markdown格式,便于我快速审阅和修改。


四、资料处理:PDF是最大痛点

在实际操作中,资料读取是最消耗时间的环节之一

4.1 PDF处理的现实

我存放的参考资料里,24份是PDF格式(年报、研报、规则文件)。AI直接读取PDF时,发现很多是扫描型/图片型文档,无法直接提取文字。最终我们用了Python的pypdf库批量提取文本,但有几个问题:

  • 表格会变成纯文本,列错位严重,需要人工校对
  • 复杂排版会乱序,图表标题和正文可能混到一起
  • 扫描型PDF完全无法读取,需要OCR,速度慢且中文识别准确率不稳定

4.2 最优方案总结

经过实测,我的建议是:

场景
推荐做法
有可复制的PDF
直接给AI,用pypdf批量提取,表格数据人工校对
只有扫描版PDF
优先找可复制版本(券商官网、数据库下载的通常是文字版)
有大量表格数据
同时给一份Excel/CSV,准确率100%
关键研报
PDF + 核心观点页另存txt,双重保险

核心结论:PDF AI能处理,但如果你有同一资料的Word/Excel版本,优先给那个。


五、数据获取:AI的金融数据接口怎么用

写研报离不开实时数据。这次我们用了ifind/NeoData金融数据接口,覆盖:

  • 个股数据:股价、市值、PE/PB/PS、ROE、股息率
  • 财务数据:营业收入、归母净利润、毛利率、费用率(历史5年)
  • 可比公司:宁德时代、特斯拉、理想、蔚来、小鹏、阳光电源的估值数据
  • 行业数据:新能源汽车销量、渗透率、出口数据

数据获取是自然语言查询——直接说”查一下比亚迪最新股价和PE”,AI自动识别需要的API并返回结果。这比手动打开ifind或Wind一个个点要快得多。

但有几个注意事项:

  • 数据接口覆盖不全:有些细分数据(比如比亚迪各品牌分车型销量)接口里没有,需要手动补充
  • 销量数据口径不一:公司公告、中汽协、乘联会的数据可能有差异,需要注明来源
  • 时间戳很重要:所有数据必须标注截止日期,否则下次更新时不知道哪些数据过期了

六、写作过程:卖方语言不是”说人话”

6.1 什么是卖方语言

卖方研报有一套自己的话语体系。我要求AI参考了10份友商研报后,总结了几个特点:

  • 观点前置:每章开头先给核心结论,再展开论证
  • 数据驱动:每个观点必须有数据支撑,”我们认为”后面要跟数字
  • 格式规范:投资案件五要素(评级/假设/差异化认知/催化剂/风险)、表格化呈现
  • 术语统一:同比增速、环比、百分点(pct)、对应PE、维持评级等
  • 风险提示量化:尽量定量分析风险对业绩的影响,而不是泛泛而谈

6.2 AI的适配过程

第一次输出的文本偏”说明文”,经过明确要求”用卖方研报语言重写”后,AI的输出质量明显提升。关键指令包括:

  • “每章开头给核心结论”
  • “用’我们认为’引导观点”
  • “表格化呈现对比数据”
  • “避免口语化表达”

6.3 图表处理

这次报告里,AI实现了12张Markdown表格,但6幅复杂图表(趋势图、循环图、阶梯图等)只能先用文字描述占位,标注”【柱状图+时间轴】展示…”

当前AI生成专业投研图表的能力还有限。我的做法是:

  • 简单数据对比 → AI直接做表格
  • 复杂趋势图/结构图 → AI写文字描述,分析师用Excel/Python做好后插入
  • 需要视觉设计的信息图 → 暂时跳过,或留到PPT版本再做

七、输出交付:Markdown → Word 转换

7.1 为什么先写Markdown

Markdown是AI最擅长的结构化文本格式。先输出Markdown的好处:

  • 审阅速度快,不用等Word打开
  • 修改成本低,直接编辑文本
  • 版本控制方便,diff一目了然

7.2 Word转换的技术实现

定稿后,我用Python的python-docx库将Markdown转换为Word,格式参数完全匹配公司模板:

  • A4纸、窄边距(上1.5cm/下1.0cm/左右1.6cm)
  • 正文宋体10.5pt,标题黑体(一级18pt、二级14pt、三级12pt)
  • 表格首行浅蓝底+黑体,内容宋体
  • 引用块楷体灰色字

这个转换脚本是可复用的——下一篇报告只需要替换Markdown源文件,就能自动生成匹配模板格式的Word。


八、经验教训:哪些做得好,哪些需要优化

8.1 做得好的地方

(1)三阶段递进节奏合理

大纲→初版→完整版,每个阶段都有明确的交付物和确认节点。没有出现”写完全文再推翻重来”的情况。

(2)资料管理前置

文件夹结构+资料清单+时间敏感检查清单,这三件套让AI在整个过程中没有”迷路”。即使对话跨了两天,AI通过读取工作记忆文件就能秒级恢复上下文。

(3)数据获取自动化

股价、估值、可比公司数据、行业销量数据都通过接口自动获取,节省了大量手动查数据的时间。

(4)不编造数据

所有不确定的数据都标注[待补充],没有为了报告好看而编造数字。这是合规底线。

8.2 需要优化的地方

(1)PDF读取仍是瓶颈

24个PDF需要批量提取+人工校对,如果未来所有资料都能提供可复制文字版或Excel,效率会大幅提升。

(2)图表生成能力有限

复杂图表需要人工后处理。如果AI能直接生成高质量的投研图表(带正确配色、字体、标注),产出效率还能再上一个台阶。

(3)财务模型搭建仍需人工

SOTP估值的净利润拆分、敏感性分析等,AI只能做框架性估算,精确模型仍需分析师在Excel中搭建。这是AI目前无法替代的核心环节。

(4)反馈机制可以更系统化

虽然每次提交成果时AI都给了反馈引导,但如果能固化为更结构化的”审阅清单”(比如每阶段必查的10个问题),审阅效率会更高。


九、工具链总结

整个流程中用到的工具和能力:

环节
工具/能力
作用
资料阅读
pypdf + python-docx
批量提取PDF/Word文本
数据查询
ifind/NeoData金融数据接口
实时股价、财务、估值数据
写作
Kimi大模型
研报正文撰写、逻辑梳理
格式转换
python-docx
Markdown → Word
项目管理
文件夹结构 + 工作记忆
跨session保持上下文

十、核心结论:AI在研报生产中的定位

跑完这一整轮流程后,我对”AI能做什么、不能做什么”有了更清晰的认识:

AI擅长的是

  • 资料阅读与信息提取(尤其是文字型资料)
  • 结构化写作(按大纲填充内容、生成表格)
  • 数据查询与整理(实时数据、可比公司数据)
  • 格式转换(Markdown → Word模板)

AI不擅长的是

  • 判断什么视角是”差异化的”(需要分析师的行业认知)
  • 精确财务建模(需要Excel功底和对业务的深度理解)
  • 合规把关(评级规范、利益冲突、免责声明)
  • 复杂图表设计与制作

最佳协作模式

分析师做”导演”,AI做”执行团队”

分析师负责确立视角、把关逻辑、校验数据、最终定稿;AI负责资料阅读、初稿撰写、数据查询、格式排版。这样分工,一篇深度报告的生产时间有望从一周压缩到2-3天,且质量不会因为提速而下降。


附录:给想尝试的同行的建议

如果你也想用AI辅助写研报,建议按以下顺序启动:

  1. 先搭框架:设计好文件夹结构和协作流程,这比急着写内容更重要
  2. 规则前置:把公司研报模板、合规要求先放进去,让AI从第一天就知道”边界”
  3. 从大纲开始:不要跳过大纲阶段,这是整篇报告的”设计图”
  4. 数据标注来源:所有数据必须可追溯,底稿核查时要有据可查
  5. 人工最终把关:AI写的报告必须经过分析师审阅,尤其是评级、目标价、核心假设

本文仅为工作流程复盘,不涉及任何个股的投资建议或估值分析。

复盘日期:2026年4月25日