开源项目分享:批量下载上市公司年报、半年报、季报的小工具
最近在整理上市公司年报资料时,遇到一个很现实的问题:
如果只看一两家公司,手动去网上下载还可以;但如果想批量阅读、分析多家公司,就会非常麻烦。
后续再用 PDF 工具、表格提取工具或 AI 工具进一步分析。
这些工作的第一步,往往就是:先把报告批量下载下来。
这次分享的工具
https://github.com/mosesyyoung/CnInfoReports
这是一个基于 Python 的巨潮资讯网公告下载工具,可以从巨潮资讯网批量下载上市公司公告 PDF。
可以通过配置股票代码列表,批量下载指定公司的报告。
对于经常需要阅读上市公司公告、年报、半年报、季报的人来说,这类工具还是挺实用的。
为什么我会关注这个工具?
之前我尝试直接用 AI 写巨潮资讯网的下载接口,但生成出来的代码经常不对,接口参数不对,多次让其修复未果。
当然,因为项目比较老,直接运行时也遇到了一些问题。为了把它跑通,我顺手修了几个 patch,并整理了 README,方便后续自己使用,也方便有类似需求的人参考。
基本用法
具体下载哪些公司、哪些年份、哪些类型的公告,可以根据 README.md 修改配置。
代码本身不复杂,如果遇到问题,也可以直接读代码调整。
适合什么人?
年报、半年报、季报是最基础的资料来源,批量下载可以节省很多重复劳动。
如果后续要做 PDF 解析、表格提取、指标计算,第一步也需要先拿到原始报告。
第三类是想学习 Python 爬取公开公告数据的人。
后续想法
以后我会不定期分享一些开源项目,主要是两类:一类是我觉得有趣的项目;另一类是确实有用的项目。
这些项目我会确认跑通、包括修复、增强等,如果只是简单工具,就写成文章分享;如果后续做了 Demo,我会放到自己的网站上。