我用7天驯服了一个AI助手:从「它能干嘛」到「合上盖子让它上班」-夜雨聆风

我用7天驯服了一个AI助手:从「它能干嘛」到「合上盖子让它上班」

这是一个真实记录。7天，一个开源AI助手 Generic Agent，从零开始，一步步变成我的数字员工。

缘起：为什么我要花7天养一个AI助手？

2026年4月，AI Agent 满天飞。Manus、Claude Code、AutoGPT……每个都号称「能替你干活」。

但我一直有个疑问：这些 Agent 真的能在我的电脑上、根据我的习惯、替我干我的活吗？

于是我决定做一个实验：装一个叫 Generic Agent（以下简称 GA）的开源工具，每天给它一个任务，记录7天——看它从「蠢萌新兵」变成「靠谱实习生」的全过程。

Day 1：文件整理——<1秒，我震惊了

给 GA 的指令：

「把 temp/ 下的所有文件按类型整理到分类文件夹」

当时我的 temp/目录散落着 PDF、Word、图片、CSV、MP3…文件随意堆放，甚至还有嵌套的「下载/」子文件夹。

按下发送，不到 1 秒，GA 返回了结果：

temp/├── 01_PDF文档/     (3个文件)├── 02_Word文档/    (3个文件)├── 03_图片/        (5个文件)├── 04_数据表格/    (2个文件)├── 05_文本笔记/    (40个文件)├── 06_音频/        (1个文件)├── 07_代码脚本/    (15个文件)└── 08_其他文件/    (1个文件)

74 个文件，8 个中文命名文件夹，0 遗漏。连「下载/」里的文件都被捞出来按类型归位。我甚至没说「用中文命名」——它自己就这么干了。

「我只说了一句话，它扫描了74个文件，不到1秒建了8个文件夹。我甚至没说中文命名，它自己就这么干了。」

Day 2：搜索 + 摘要——9秒读完今天的 AI 圈

给 GA 的指令：

「搜索今天 AI 行业 3 条重要新闻，生成摘要」

GA 没有问我「用哪个搜索引擎」，自己选了 Google News RSS，同时检索了三个维度：AI产业总览、DeepSeek动态、AI Agent工具。

9 秒后，抓取 9 条标题，聚焦出 3 条最有价值的：

DeepSeek 发布新模型——MIT Tech Review：「正在缩小与前端的差距」
美国国务院全球警告：DeepSeek 涉嫌 AI 技术盗窃（Reuters）
Google Cloud Next 2026：AI Agent 普及需要文化转变（BizTech）

MIT 在夸、美国政府却在警告——这种对立信息放在一起，比我自己刷十分钟还清楚。

「9秒后它告诉我，DeepSeek新模型被MIT叫好，但美国政府却在警告它偷技术。两条新闻放一起，比刷十分钟还清楚。」

Day 3：浏览器自动化——1.6秒，一个CSV躺在我桌面上

给 GA 的指令：

「打开 Hacker News，抓取前 10 条标题和分数，存为 CSV」

1.6 秒后，hackernews_top10.csv躺在桌面上：

Rank	Title	Points
1	Google plans to invest up to $40B in Anthropic	452
2	Turbo Vision 2.0 – a modern port	18
3	Paraloid B-72	108
…	…	…

TOP 1 是「Google 向 Anthropic 投 400 亿美元」——452 分碾压第二名。

手动做同样的事：打开网页 → 复制粘贴到 Excel → 调格式 → 保存——至少 5 分钟。GA：1.6 秒。

「我对GA说’抓Hacker News存表格’，不到2秒一个CSV躺在我桌面上。手动至少5分钟。」

Day 4：聊天平台接入——第一次翻车

给 GA 的指令：

「接入飞书 Bot，让我能在手机上给 GA 发消息」

GA 停住了。它给我一个授权链接，但——需要我打开手机扫码。浏览器和 GA 不在同一个环境，打不开本地页面。

这是我 7 天里第一次遇到「GA 做不到」的情况。后来手动扫码完成，飞书 Bot 成功接入。

复盘：不是所有任务都能全自动。扫码授权是给「人」设计的——GA 的边界在需要人类肉身的地方。这个发现反而让我更清楚它的定位。

「第四天翻车了——GA要我扫码，它做不到。但这是公平的：扫码本来就是给人设计的。不是万能的神，是能干80%活的实习生。」

Day 5：定时任务——「以后每天 8 点自动给我发日报」

给 GA 的指令：

「写一个脚本，每天 8 点自动抓取 AI 新闻，存到我本地文件夹」

GA 写好 daily_digest.py，配好 cron 0 8 * * *。设好我就忘了。

第 5 天早上，~/GA_daily_digests/下已经攒了 5 份日报。

这是 GA 从「一次性工具」变成「系统」的转折点。它不再是我每次手动调用的帮手——它成了我工作流里自动运转的一部分。

「我让GA写了个脚本每天8点自动抓新闻。设好就忘了。第5天早上打开，已经攒了5份日报。」

Day 6：子代理并行——同时查 3 个站，0.9 秒收工

给 GA 的指令：

「同时查 GitHub Trending、Hacker News、Papers With Code，汇总到一个文件」

GA 同时开了 3 个「子代理」，并行干活：

数据源	结果
GitHub Trending	claude-code (2.1k⭐), codex (1.8k⭐), autogen (1.2k⭐)
Hacker News	Google-Anthropic $40B (452pts), GPT-5 rumors (389pts)
Papers With Code	MoE Routing 98.2%, RAG Long-context benchmark

三个源汇总到 daily_tech_roundup.txt，总耗时 0.9 秒。

手动做：打开三个网页、复制粘贴、排版——至少 10 分钟。这是 AI Agent 对人类的降维打击：人类注意力是单线程的，GA 可以同时做 N 件事。

「我说’同时查3个站’，GA开了3个子代理，0.9秒收工。手动至少10分钟。并行才是Agent真正的生产力革命。」

Day 7：自主模式——合上盖子，让它自己干活

最后一天，我在 TODO.txt里写了三件事：

1. 检查 temp/ 目录是否整洁2. 验证 hackernews_top10.csv 是否完整3. 生成 daily_log.txt 记录完成情况

然后，我合上笔记本电脑，去吃饭。

GA 的「自主模式」是一条完整的自动流水线：读 TODO → 拆解 → 执行 → 写报告。只要电脑没关机，它就能自己干活。

半小时后回来，打开 daily_log.txt：

✅ Task 1: temp/ organized — 74 files into 8 categories✅ Task 2: CSV validated — 10 rows, file intact✅ Task 3: log generatedTotal: 0.8s | Status: ALL DONE

三条任务，全部完成，0.8 秒。

那一刻我理解了什么叫「合上盖子，让 AI 上班」。

「我在TODO里写了3件事，合上电脑去吃饭。回来daily_log.txt已经躺着了，3件事全做完，0.8秒。那一刻我理解了什么叫合上盖子让AI上班。」

7 天总结：GA 到底改变了什么？

天数	任务	耗时	核心能力
Day 1	文件整理	<1s	文件系统操作
Day 2	搜索+摘要	9s	信息检索+筛选
Day 3	浏览器自动化	1.6s	网页抓取+结构化
Day 4	Bot接入	—	需人工扫码（诚实记录）
Day 5	定时任务	—	脚本+cron自动化
Day 6	并行处理	0.9s	子代理并行
Day 7	自主模式	0.8s	无人值守全自动

7 天前，我问：「它能干嘛？」

7 天后，我的答案：它能干我 80% 的重复性工作，而且干得比我快 10 倍以上。剩下的 20%，是需要我肉身出马的事。

但最关键的变化不是效率——是心态。

以前，整理文件、抓数据、查新闻，要「专门找时间做」。现在，对 GA 说一句话就够了。任务从「要不要做」变成了「已经做了」。

AI Agent 的价值不是替代你，是把你从「要不要做」的纠结里解放出来。

你也能开始

装 GA：git clone https://github.com/datawhalechina/hello-generic-agent
配模型：在 mykey.py填 API Key
开口说：python launch.pyw，第一天就说「帮我把桌面文件整理一下」

不需要会写代码。只需要会打字。

💬 你驯养过 AI Agent 吗？你的「Day 7」是什么体验？评论区聊聊。

👇 下一篇预告：给 AI 装上眼睛——OCR + 视觉能力解锁全攻略