用AI写公司深度研报——全流程复盘与方法论总结-夜雨聆风

用AI写公司深度研报——全流程复盘与方法论总结

前言

这两天（准确说是几个小时前到现在…），我做了一个实验：用AI（Kimi/WorkBuddy）辅助完成一篇A股公司深度研报。从项目搭建、资料阅读、大纲拟定、初版撰写到完整报告输出，整个流程走了一遍。这篇复盘记录的不是某家公司的投资价值，而是 “AI如何嵌入卖方研报生产流程” 的方法论探索。如果你也是投研从业者，或许能从中找到一些可复用的思路。

一、为什么要做这件事

券商研究所的日常工作里，深度报告是核心产出，但也是时间黑洞。一篇30-40页的深度报告，传统流程通常需要：

阅读数十份资料（年报、季报、调研纪要、参考研报）
整理数据、制作图表、搭建财务模型
反复修改结构、措辞、格式
最后对齐公司模板，调整页眉页脚、免责声明

整个过程动辄一周甚至更久。我一直在想：哪些环节可以被AI提效？哪些环节必须人工把关？AI和分析师的最佳协作界面在哪里？

带着这些问题，我搭建了一个专门用于”AI辅助研报撰写”的项目框架，以某新能源汽车龙头公司为样本，跑通了全流程。

二、项目架构设计：让AI有章可循

要让AI有效地辅助写研报，首先要解决一个基础问题：资料和输出的秩序。如果AI每次都要问”文件在哪里”，效率就大打折扣。

2.1 文件夹结构

我设计了四层文件夹结构：

公司深度撰写项目/
├── 01_参考资料/
│   ├── 01_研报撰写规则及指导/   ← 质控合规规则、撰写培训材料
│   ├── 02_参考研报/             ← 友商同类深度报告
│   ├── 03_公司定期报告/         ← 季报、年报、半年报
│   ├── 04_公司调研纪要/         ← 调研纪要、业绩说明会
│   ├── 05_公司销量数据/         ← 月度/季度销量、分车型数据
│   └── 06_公司其他参考资料/     ← 公告、ESG、新闻、公众号文章等
├── 02_格式模板/                 ← 公司研报 Word 模板
├── 03_研报工作区/
│   ├── 01_提纲与讨论/           ← 大纲初稿及讨论记录
│   ├── 02_初版简报/             ← 简化版初步研报
│   └── 03_完整报告/             ← 完整版 Markdown 草稿
└── 04_最终输出/                 ← Markdown 定稿 + Word 终稿

这个结构的核心逻辑是：左边输入（参考资料），中间加工（工作区），右边输出（终稿）。AI知道自己的”阅读范围”和”写作范围”，不会乱写文件。

2.2 资料清单机制

我要求AI维护一份资料清单，每份文件标注：

文件名、格式、页数、核心内容
阅读状态（已读/待读）
数据缺口（哪些数据这份资料里没有）

这个机制的好处是：后续新增资料时，AI能秒级定位，不用反复翻目录。对于经常需要更新数据的研报项目，这是一个必要的”索引层”。

2.3 时间敏感检查清单

研报最怕数据过时。我建立了一个检查清单，每次进入新阶段前，AI主动确认：

股价/市值/估值是否最新？
最新月度/季度销量出了吗？
行业政策有变化吗？
竞争对手有什么新动态？

这个机制强制AI在动笔前”刷新”数据，避免用两个月前的销量数据写报告。

三、三阶段工作法：大纲 → 初版 → 完整版

我坚持的流程是三阶段递进，每个阶段都是”先输出、再讨论、后迭代”。这个节奏很关键——它避免了”写完全文才发现结构有问题”的灾难。

3.1 阶段一：拟定大纲（最关键的一步）

大纲阶段的核心任务不是写内容，而是确立视角和结构。

我放了10份参考研报、4份撰写规则文件、1份年报、5份调研纪要给AI。AI的阅读顺序是：

先读规则——了解合规要求、评级规范、免责声明格式
再读参考研报——学习友商的结构、视角、论证方式
最后读公司资料——提取基本面数据、管理层表述、战略方向

在消化这些资料后，AI提出了一份大纲。这里有个关键点：大纲必须有差异化视角。如果大纲只是”公司介绍+财务分析+估值”的流水账，那这篇报告就没有存在的意义。

最终我们定稿的大纲六章结构是：公司概览 → 技术护城河 → 全球化 → 高端化 → 业务拆分与财务分析 → 风险提示。整个讨论过程中，用户（我）对大纲做了两次结构性调整（合并章节、简化风险提示），AI根据反馈即时修改。

经验：大纲讨论得越充分，后续返工越少。这次大纲阶段大约占整个项目30%的时间，但避免了完整版阶段的结构性重写。

3.2 阶段二：初版简报（验证逻辑）

初版简报是一份结构完整但内容精炼的版本，每章只写核心论点和关键数据，篇幅控制在5-8页。

这个阶段的目的有三个：

验证大纲的逻辑是否自洽
确认数据假设是否合理（销量、毛利率、费用率等）
确定估值框架（我们用SOTP分部估值）

初版简报写完后，我要求AI补充了实时数据：

股价、市值、PE/PB
可比公司估值（宁德时代、特斯拉、理想等）
最新销量数据

这些数据通过ifind/NeoData金融数据接口自动获取，不需要手动查。AI将数据填入简报后，SOTP估值框架就有了初步轮廓。

3.3 阶段三：完整版报告（扩充深度）

完整版的核心任务是：在初版骨架上填充肌肉。

这个阶段AI做了几件事：

每章展开为3-5个小节，补充论据和数据
插入12张表格（业务对比、财务指标、估值框架等）
用文字描述6幅图表的呈现方式（因为当前AI绘图能力有限，复杂图表先占位）
数据空缺处标注**[待补充]**，不编造数据

完整版输出为Markdown格式，便于我快速审阅和修改。

四、资料处理：PDF是最大痛点

在实际操作中，资料读取是最消耗时间的环节之一。

4.1 PDF处理的现实

我存放的参考资料里，24份是PDF格式（年报、研报、规则文件）。AI直接读取PDF时，发现很多是扫描型/图片型文档，无法直接提取文字。最终我们用了Python的pypdf库批量提取文本，但有几个问题：

表格会变成纯文本，列错位严重，需要人工校对
复杂排版会乱序，图表标题和正文可能混到一起
扫描型PDF完全无法读取，需要OCR，速度慢且中文识别准确率不稳定

4.2 最优方案总结

经过实测，我的建议是：

场景	推荐做法
有可复制的PDF	直接给AI，用pypdf批量提取，表格数据人工校对
只有扫描版PDF	优先找可复制版本（券商官网、数据库下载的通常是文字版）
有大量表格数据	同时给一份Excel/CSV，准确率100%
关键研报	PDF + 核心观点页另存txt，双重保险

核心结论：PDF AI能处理，但如果你有同一资料的Word/Excel版本，优先给那个。

五、数据获取：AI的金融数据接口怎么用

写研报离不开实时数据。这次我们用了ifind/NeoData金融数据接口，覆盖：

个股数据：股价、市值、PE/PB/PS、ROE、股息率
财务数据：营业收入、归母净利润、毛利率、费用率（历史5年）
可比公司：宁德时代、特斯拉、理想、蔚来、小鹏、阳光电源的估值数据
行业数据：新能源汽车销量、渗透率、出口数据

数据获取是自然语言查询——直接说”查一下比亚迪最新股价和PE”，AI自动识别需要的API并返回结果。这比手动打开ifind或Wind一个个点要快得多。

但有几个注意事项：

数据接口覆盖不全：有些细分数据（比如比亚迪各品牌分车型销量）接口里没有，需要手动补充
销量数据口径不一：公司公告、中汽协、乘联会的数据可能有差异，需要注明来源
时间戳很重要：所有数据必须标注截止日期，否则下次更新时不知道哪些数据过期了

六、写作过程：卖方语言不是”说人话”

6.1 什么是卖方语言

卖方研报有一套自己的话语体系。我要求AI参考了10份友商研报后，总结了几个特点：

观点前置：每章开头先给核心结论，再展开论证
数据驱动：每个观点必须有数据支撑，”我们认为”后面要跟数字
格式规范：投资案件五要素（评级/假设/差异化认知/催化剂/风险）、表格化呈现
术语统一：同比增速、环比、百分点（pct）、对应PE、维持评级等
风险提示量化：尽量定量分析风险对业绩的影响，而不是泛泛而谈

6.2 AI的适配过程

第一次输出的文本偏”说明文”，经过明确要求”用卖方研报语言重写”后，AI的输出质量明显提升。关键指令包括：

“每章开头给核心结论”
“用’我们认为’引导观点”
“表格化呈现对比数据”
“避免口语化表达”

6.3 图表处理

这次报告里，AI实现了12张Markdown表格，但6幅复杂图表（趋势图、循环图、阶梯图等）只能先用文字描述占位，标注”【柱状图+时间轴】展示…”

当前AI生成专业投研图表的能力还有限。我的做法是：

简单数据对比 → AI直接做表格
复杂趋势图/结构图 → AI写文字描述，分析师用Excel/Python做好后插入
需要视觉设计的信息图 → 暂时跳过，或留到PPT版本再做

七、输出交付：Markdown → Word 转换

7.1 为什么先写Markdown

Markdown是AI最擅长的结构化文本格式。先输出Markdown的好处：

审阅速度快，不用等Word打开
修改成本低，直接编辑文本
版本控制方便，diff一目了然

7.2 Word转换的技术实现

定稿后，我用Python的python-docx库将Markdown转换为Word，格式参数完全匹配公司模板：

A4纸、窄边距（上1.5cm/下1.0cm/左右1.6cm）
正文宋体10.5pt，标题黑体（一级18pt、二级14pt、三级12pt）
表格首行浅蓝底+黑体，内容宋体
引用块楷体灰色字

这个转换脚本是可复用的——下一篇报告只需要替换Markdown源文件，就能自动生成匹配模板格式的Word。

八、经验教训：哪些做得好，哪些需要优化

8.1 做得好的地方

（1）三阶段递进节奏合理

大纲→初版→完整版，每个阶段都有明确的交付物和确认节点。没有出现”写完全文再推翻重来”的情况。

（2）资料管理前置

文件夹结构+资料清单+时间敏感检查清单，这三件套让AI在整个过程中没有”迷路”。即使对话跨了两天，AI通过读取工作记忆文件就能秒级恢复上下文。

（3）数据获取自动化

股价、估值、可比公司数据、行业销量数据都通过接口自动获取，节省了大量手动查数据的时间。

（4）不编造数据

所有不确定的数据都标注[待补充]，没有为了报告好看而编造数字。这是合规底线。

8.2 需要优化的地方

（1）PDF读取仍是瓶颈

24个PDF需要批量提取+人工校对，如果未来所有资料都能提供可复制文字版或Excel，效率会大幅提升。

（2）图表生成能力有限

复杂图表需要人工后处理。如果AI能直接生成高质量的投研图表（带正确配色、字体、标注），产出效率还能再上一个台阶。

（3）财务模型搭建仍需人工

SOTP估值的净利润拆分、敏感性分析等，AI只能做框架性估算，精确模型仍需分析师在Excel中搭建。这是AI目前无法替代的核心环节。

（4）反馈机制可以更系统化

虽然每次提交成果时AI都给了反馈引导，但如果能固化为更结构化的”审阅清单”（比如每阶段必查的10个问题），审阅效率会更高。

九、工具链总结

整个流程中用到的工具和能力：

环节	工具/能力	作用
资料阅读	pypdf + python-docx	批量提取PDF/Word文本
数据查询	ifind/NeoData金融数据接口	实时股价、财务、估值数据
写作	Kimi大模型	研报正文撰写、逻辑梳理
格式转换	python-docx	Markdown → Word
项目管理	文件夹结构 + 工作记忆	跨session保持上下文

十、核心结论：AI在研报生产中的定位

跑完这一整轮流程后，我对”AI能做什么、不能做什么”有了更清晰的认识：

AI擅长的是：

资料阅读与信息提取（尤其是文字型资料）
结构化写作（按大纲填充内容、生成表格）
数据查询与整理（实时数据、可比公司数据）
格式转换（Markdown → Word模板）

AI不擅长的是：

判断什么视角是”差异化的”（需要分析师的行业认知）
精确财务建模（需要Excel功底和对业务的深度理解）
合规把关（评级规范、利益冲突、免责声明）
复杂图表设计与制作

最佳协作模式：

分析师做”导演”，AI做”执行团队”

分析师负责确立视角、把关逻辑、校验数据、最终定稿；AI负责资料阅读、初稿撰写、数据查询、格式排版。这样分工，一篇深度报告的生产时间有望从一周压缩到2-3天，且质量不会因为提速而下降。

附录：给想尝试的同行的建议

如果你也想用AI辅助写研报，建议按以下顺序启动：

先搭框架：设计好文件夹结构和协作流程，这比急着写内容更重要
规则前置：把公司研报模板、合规要求先放进去，让AI从第一天就知道”边界”
从大纲开始：不要跳过大纲阶段，这是整篇报告的”设计图”
数据标注来源：所有数据必须可追溯，底稿核查时要有据可查
人工最终把关：AI写的报告必须经过分析师审阅，尤其是评级、目标价、核心假设

本文仅为工作流程复盘，不涉及任何个股的投资建议或估值分析。

复盘日期：2026年4月25日