AI 研究股票系列:基础工具准备 一 有不少朋友后台私信问怎么开始用AI研究股票数据。 可能之前的分享针对的是有一定经验的朋友,而且由于篇幅限制没有对基础和细节展开。 基础和细节,在文字层面表达较为复杂,在视频讲教程更为合适,我正在准备着视频的内容,但视频制作工作流让我一直停滞不前。 那先照顾一下确实没有接触过AI或者AI编程的朋友,说说AI研究股票需要使用的基础工具。也是启发式,没有明确的工作步骤细节(其实细节步骤的文字在公众号一搜就一堆AI生成的了,所以,动起来吧!)。 首先AI工具,我推荐使用codebuddy或者qoder,首选codebuddy,因为免费额度多点、免费模型透明,qoder免费显示“轻量”,具体是豆包还是qwen不知道。而codebuddy可以自己选的,选个deepseek V4内心踏实。 暂时不要考虑其他编程工具,包括什么claude 、opencode、openclaw通通不管,下载和部署这些工具存在技术要求,耗费精力学习。刚开始宁愿花一点金钱成本(200以内一个月),把工作流程搭建起来更好,首要目标是用上AI研究。其他以后再算。 有了codebuddy或者qoder,就可以告诉它想做事情——研究股票数据。让他规划和操作剩下的内容,包括安装python和相关的python库。python库是别人提前做好的的功能,就像电脑系统和软件、ios和app这件的关系,安装好了相关的库就可以减少很多自己做的事情。这部分可以完全用codebuddy来完成。不过注意python版本尽量不要用最新的,有些库不支持不兼容。 一般必需的库有Pandas(处理表格数据如日线、复权因子,做筛选、合并、缺失值填充、时间序列重采样……), NumPy(底层数值计算,配合 Pandas 使用),回测用的Backtrader,还有深度学习用的库。有些库如果终端模式下载很慢的,直接自己复制到豆包问如何手工下载,这样会更快。 二 股票数据来源,之前在用AI研究股票,用什么数据比较方便?已经说过了,用通达信的数据。而且用通达信官方软件(https://www.tdx.com.cn/soft.html),不用券商版,官方版的版面简洁。从1990年1月1日开始全部日线数据下载,本地数据在:通达信根目录 → tdx → vipdoc,把路径复制给codebuddy,他会读取的了。 用codebuddy把数据格式转换成更方便深度学习的格式,这样读取快而且很轻量(原来15G转换后1G不到)。还需要复权处理,利用同花顺skill(AI研究股票系列:龙虾对基本面分析的辅助)获取分红配股信息,然后进行复权处理。省事一点的就在某鱼中直接买,我也是这样的。如果有朋友有更方面的下载全量复权数据的方法,期待分享一下。 三 学习工具——公众号文章、网页豆包或deepseek。 公众号是学习AI的最好工具,这是我的经验和观点。即使是那些用AI生成文章,也是博主经过一定思维加工,经过筛选主题的。我也怀着学习和感觉的心态看人家的文章,哪怕有些人是直接复制粘贴AI生成,连md文档的格式也还懂处理。但如果有某个点刚好解决了现在的问题,那就是非常值得了,有时候可能值一千几百! 寻找值得投资的好股票,就像在石头下面找小虫子一样。翻开10块石头,可能只会找到一只,翻开20块石头可能找到两只。 彼得林奇 总结来说,利用公众号\豆包学习和整体规划,用codebuddy作为AI主力入手,通达信/同花顺最为股票数据源。反复尝试几个月,应该就知道什么可以做,什么不可以做了。知道AI强大在哪里,哪里还需要人工干预!