项目复盘 / QQ 信息收集
把群聊里的零散信息,整理成每天能看懂的摘要。
整理时间:2026 年 5 月 8 日
原创整理:Neo超哥
本文基于当天 QQ 信息收集项目、Codex 对话记录、本地网页面板和已打码素材整理。为保护隐私,文中不公开真实 QQ 号、群成员身份、登录信息、Token、Cookie 和未打码身份信息;部分聊天正文会保留,用来对照网页是否确实拿到了正确数据。
今天这个项目,我先给它起了一个名字:
QQ咨询收集大师。
名字听起来有点像小工具,但我真正想解决的不是“做一个好玩的机器人”,而是一个很具体的问题:
群聊里每天会产生很多信息,但人不可能一直盯着看。
有些群聊很水,有些消息只是表情和闲聊,但里面偶尔也会冒出工具、教程、资源、游戏推荐、问题求助、价格信息,甚至一些以后可以写成内容的灵感。
如果我不看,可能会错过。 如果我一直看,又太浪费时间。
所以我今天尝试做的是:把 QQ 里的信息收进本地,再让 AI 帮我整理成每天能扫一眼的摘要。

一、我不是想做一个聊天机器人
一开始我问的是:能不能把 Codex 接入 QQ 群?
但聊着聊着我发现,问题不能这么问。
因为我真正需要的不是一个会在群里说话的机器人,也不是让别人专门 @ 它投稿。我需要的是:
群里别人正常聊天以后,我能在一天结束时知道他们主要聊了什么。
这就变成了另一个方向:
群消息能不能进入本地; 能不能保存起来; 能不能按我关心的方向筛选; 能不能把闲聊、表情、欢迎语这种噪声降下来; 能不能最后整理成一份我看得懂的日报。
所以这个项目更像一个私人信息秘书。
它不需要在群里抢话,也不需要打扰别人。它要做的是:把已经发生的信息收集起来,整理、归类、复盘。

二、小白版技术路线
这件事表面上看是“AI 总结 QQ 群”,但真正跑起来之前,先要解决数据入口。
我的理解是:
AI 很会总结,但它不能凭空知道 QQ 群里发生了什么。
所以今天先搭了一条本地链路:
QQ 群产生消息 -> NapCat 转发消息 -> OneBot 标准格式 -> 本地服务接收 -> SQLite 保存 -> 网页面板查看和筛选 -> Codex 整理总结并出图这里面几个词,可以用更白话的方式理解:
NapCat 像快递员,负责把 QQ 那边的消息送出来。
OneBot 像标准快递单,把消息整理成程序能看懂的格式。
本地服务像收件窗口,负责接住消息。
SQLite 像本地仓库,把消息、群列表、设置和反馈都存起来。
网页面板像控制台,让我能看到有哪些群、哪些消息进来了、哪些内容有用。
Codex 最后才像信息秘书,负责帮我读、归纳、整理成文章和图。

三、今天已经跑出来的阶段成果
今天这件事不是停在想法里,已经有阶段性结果了。
当前做出来的能力包括:
真实 QQ 群列表已经能同步到本地网页。 可以选择某个群打开信息收集。 可以拉取消息,让消息进入本地数据库。 网页里可以查看最新消息。 每条消息可以删除,也可以反馈“有用”“没用”“以后少看”。 图片、表情、视频这类内容不会空着,而是变成可读占位。 自动欢迎、频道邀请这类重复内容,已经会被识别成背景噪声。 Codex 可以读取当天数据,整理成公众号可用长图。
今天重点测试的是一个游戏交流群。
阶段数据大概是:
457 条 入库消息 /57 人 成员估算 /14:43 到 21:05 测试时间
自动欢迎 23 条;兴趣案例 14 条。
这组数字不算完美,但它说明一件事:链路已经跑通了。

四、这张图是今天最直观的成果
为了让结果更适合公众号展示,我没有把所有原始消息直接贴出来,而是让 Codex 重新读取当天数据库,整理出一张日报长图。
这张图不是为了证明“系统已经完美”,而是为了展示:
一个群聊经过整理以后,可以变成一份可阅读的信息摘要。

从这张图里可以看出来,这个游戏群当天主要聊了几类内容:
Steam 账号、平台和正版支持; 极限国度、育碧、加速器; 手柄、主机设备和震动体验; 木筏求生之类的联机需求; 双点系列、Black Souls 类似游戏推荐; 账号登录、申诉、实名、网络问题; 普通闲聊、图片、表情和自动欢迎。
我觉得这里比较有价值的不是某一条消息,而是它把“群里今天在发生什么”提炼出来了。
比如我不用从 457 条消息里翻半天,就能知道:
这个群今天主要不是在聊资讯,而是在聊游戏推荐、一起玩、账号登录、网络加速、设备体验。
这就够了。
因为对我来说,很多时候我不是要逐字阅读群聊,而是想快速判断:
这个群今天有没有值得我回头看的东西。
五、为什么这件事和行业认知有关
我今天做这个工具,还有一个更大的思考:行业认知不一定只来自报告、课程和公开文章。
我做这个 QQ 群信息收集,是因为它让我想到一件事:很多职业、很多行业里,都会有一些真正懂行的人,平时就喜欢在各种 QQ 群里聊天。
他们未必天天写文章,也未必把经验整理成课程,但他们会在日常聊天里露出很多细节:
他们遇到什么问题; 他们习惯用什么工具; 他们对哪些东西敏感; 他们怎么看一个新产品; 他们会吐槽什么坑; 他们随口提到哪些行业里的真实做法。
这些东西单条看起来可能很碎,但长期收集下来,就会变成一种很有价值的行业现场。
比如今天测试的是游戏群,它能让我看到玩家真正关心的是联机、账号、平台、设备、加速器和游戏推荐。换成别的职业群,也可能看到那个行业每天真实发生的小问题、小经验和小判断。
所以 QQ咨询收集大师不是为了窥探谁说了什么,而是想把公开聊天里那些原本刷过去就没了的行业细节,变成可以回头看的认知线索。
六、为什么这件事也和自媒体有关
自媒体这块,我想表达得更准确一点:它不是我今天已经完成的结果,而是我接下来准备做的事。
我后面准备把公众号内容同步推送到其他平台,不只是写完一篇就结束,而是逐步把自己的项目、思考、复盘和成果展示出来。
最近看到追觅员工事件,我一个很强的感受是:在网络平台上持续展示自己,其实很重要。
很多时候,一个人做过什么、解决过什么问题、有什么能力、怎么思考问题,如果平时没有留下公开记录,别人是很难知道的。
所以我接下来做自媒体,不只是为了“发内容”,也是为了把自己的能力和过程持续展示出来:
做了什么项目; 解决了什么问题; 中间踩了什么坑; 最后有什么阶段成果; 后面准备怎么继续改。
QQ咨询收集大师和自媒体的关系就在这里:它不是自媒体本身,而是给后续内容输出提供真实素材,也给我提供一个可以持续展示的项目案例。
七、现在还不完美,但已经值得记录
今天的版本肯定还很早。
它还需要继续优化:
每个群应该有不同规则; 闲聊和高价值信息还要继续区分; 图片里的表达可以更美观; “有用/没用/以后少看”的反馈要继续训练; API 自动日报以后可以研究,但现在不急着烧钱; 隐私打码和公开边界还要长期保持谨慎。
但我觉得它已经有阶段性价值了。
因为它从一个模糊想法,变成了一个能跑起来的链路:
QQ 信息进入本地,网页能看到,数据库能保存,Codex 能整理,最后还能生成一张公众号长图。
这就不是纯想法了。
它已经是一个可以继续迭代的雏形。
结尾
今天这个小项目给我的感受是:
很多 AI 应用真正难的地方,不是最后那句“让 AI 总结一下”。
真正难的是前面那一整段:
信息从哪里来,怎么保存,怎么筛选,怎么保护隐私,怎么让它长期变成自己的资料。
我做 QQ咨询收集大师,本质上不是为了盯群。
而是想把原本刷过去就没了的信息,变成可以复盘、可以沉淀、可以继续加工的材料。
现在它还不完美。
但它已经开始工作了。
后面我会继续改。
~~敬请期待~~
夜雨聆风