乐于分享
好东西不私藏

Python3 源代码和软件 | 抓取小红书笔记的评论和回复

本文最后更新于2026-01-02,某些文章具有时效性,若有错误或已失效,请在下方留言或联系老夜

Python3 源代码和软件 | 抓取小红书笔记的评论和回复

前阵子推送的 Python3 源代码 | 抓取任意小红书话题笔记,并下载高清无水印图片 是根据话题抓取的笔记,今天说的是根据笔记 note_id 抓取笔记下面的评论

抓取的站点是小红书网页版本,需要事先登录这个站点,否则只能看到前面小部分评论

https://www.xiaohongshu.com/

下面这条笔记,它的的 note_id 就是 65574768000000001b00d4c7

https://www.xiaohongshu.com/explore/65574768000000001b00d4c7

抓取保存在 csv 文件中,以 {note_id}.csv 命令,字段信息包括评论 id、评论时间、ip 属地、评论内容、点赞数、回复数、评论用户名、评论用户、是否是根评论、是否是笔记作者评论等等十余个字段。

这个爬虫还具有以下功能:

  1. 可根据 note_id 列表批量抓取多个笔记的评论。
  2. 可配置是否抓取评论的回复。
  3. 可多次运行增量抓取评论,自动去重。
  4. 可调整请求间隔时间来修改抓取速度,建议速度不要太快,slp_tms 设置为 6-12s 为宜,太快了可能会有封号或者暂时禁止登录的风险。

运行代码,主要替换 headers(里面的 cookie) 和待抓取评论的笔记 note_id_list 即可。

再次提醒,抓取休眠时间尽量设置较大,尽量使用小号测试,休眠时间过短不能排除封号的可能性。

代码获取地址如下,可点击阅读原文直达,随时更新~

https://mbd.pub/o/bread/mbd-ZZeTlJ1u

有些读者可能没有或者不想安装 Python 环境,对此我准备了开箱即用、双击运行的 exe 软件,也在上述地址中获取~,exe 版本只需要在对应的 config.json 文件中设置好 cookie、休眠时间、待抓取的小红书笔记 id 等内容即可抓取。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Python3 源代码和软件 | 抓取小红书笔记的评论和回复

评论 抢沙发

1 + 6 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮