乐于分享
好东西不私藏

我用7天驯服了一个AI助手:从「它能干嘛」到「合上盖子让它上班」

我用7天驯服了一个AI助手:从「它能干嘛」到「合上盖子让它上班」

这是一个真实记录。7天,一个开源AI助手 Generic Agent,从零开始,一步步变成我的数字员工。


缘起:为什么我要花7天养一个AI助手?

2026年4月,AI Agent 满天飞。Manus、Claude Code、AutoGPT……每个都号称「能替你干活」。

但我一直有个疑问:这些 Agent 真的能在我的电脑上、根据我的习惯、替我干我的活吗?

于是我决定做一个实验:装一个叫 Generic Agent(以下简称 GA)的开源工具,每天给它一个任务,记录7天——看它从「蠢萌新兵」变成「靠谱实习生」的全过程。


Day 1:文件整理——<1秒,我震惊了

给 GA 的指令:

「把 temp/ 下的所有文件按类型整理到分类文件夹」

当时我的 temp/目录散落着 PDF、Word、图片、CSV、MP3…文件随意堆放,甚至还有嵌套的「下载/」子文件夹。

按下发送,不到 1 秒,GA 返回了结果:

temp/├── 01_PDF文档/     (3个文件)├── 02_Word文档/    (3个文件)├── 03_图片/        (5个文件)├── 04_数据表格/    (2个文件)├── 05_文本笔记/    (40个文件)├── 06_音频/        (1个文件)├── 07_代码脚本/    (15个文件)└── 08_其他文件/    (1个文件)

74 个文件,8 个中文命名文件夹,0 遗漏。连「下载/」里的文件都被捞出来按类型归位。我甚至没说「用中文命名」——它自己就这么干了。

「我只说了一句话,它扫描了74个文件,不到1秒建了8个文件夹。我甚至没说中文命名,它自己就这么干了。」


Day 2:搜索 + 摘要——9秒读完今天的 AI 圈

给 GA 的指令:

「搜索今天 AI 行业 3 条重要新闻,生成摘要」

GA 没有问我「用哪个搜索引擎」,自己选了 Google News RSS,同时检索了三个维度:AI产业总览、DeepSeek动态、AI Agent工具。

9 秒后,抓取 9 条标题,聚焦出 3 条最有价值的:

  1. DeepSeek 发布新模型——MIT Tech Review:「正在缩小与前端的差距」
  2. 美国国务院全球警告:DeepSeek 涉嫌 AI 技术盗窃(Reuters)
  3. Google Cloud Next 2026:AI Agent 普及需要文化转变(BizTech)

MIT 在夸、美国政府却在警告——这种对立信息放在一起,比我自己刷十分钟还清楚。

「9秒后它告诉我,DeepSeek新模型被MIT叫好,但美国政府却在警告它偷技术。两条新闻放一起,比刷十分钟还清楚。」


Day 3:浏览器自动化——1.6秒,一个CSV躺在我桌面上

给 GA 的指令:

「打开 Hacker News,抓取前 10 条标题和分数,存为 CSV」

1.6 秒后,hackernews_top10.csv躺在桌面上:

Rank
Title
Points
1
Google plans to invest up to $40B in Anthropic
452
2
Turbo Vision 2.0 – a modern port
18
3
Paraloid B-72
108

TOP 1 是「Google 向 Anthropic 投 400 亿美元」——452 分碾压第二名。

手动做同样的事:打开网页 → 复制粘贴到 Excel → 调格式 → 保存——至少 5 分钟。GA:1.6 秒。

「我对GA说’抓Hacker News存表格’,不到2秒一个CSV躺在我桌面上。手动至少5分钟。」


Day 4:聊天平台接入——第一次翻车

给 GA 的指令:

「接入飞书 Bot,让我能在手机上给 GA 发消息」

GA 停住了。它给我一个授权链接,但——需要我打开手机扫码。浏览器和 GA 不在同一个环境,打不开本地页面。

这是我 7 天里第一次遇到「GA 做不到」的情况。后来手动扫码完成,飞书 Bot 成功接入。

复盘:不是所有任务都能全自动。扫码授权是给「人」设计的——GA 的边界在需要人类肉身的地方。这个发现反而让我更清楚它的定位。

「第四天翻车了——GA要我扫码,它做不到。但这是公平的:扫码本来就是给人设计的。不是万能的神,是能干80%活的实习生。」


Day 5:定时任务——「以后每天 8 点自动给我发日报」

给 GA 的指令:

「写一个脚本,每天 8 点自动抓取 AI 新闻,存到我本地文件夹」

GA 写好 daily_digest.py,配好 cron 0 8 * * *。设好我就忘了。

第 5 天早上,~/GA_daily_digests/下已经攒了 5 份日报。

这是 GA 从「一次性工具」变成「系统」的转折点。它不再是我每次手动调用的帮手——它成了我工作流里自动运转的一部分。

「我让GA写了个脚本每天8点自动抓新闻。设好就忘了。第5天早上打开,已经攒了5份日报。」


Day 6:子代理并行——同时查 3 个站,0.9 秒收工

给 GA 的指令:

「同时查 GitHub Trending、Hacker News、Papers With Code,汇总到一个文件」

GA 同时开了 3 个「子代理」,并行干活:

数据源
结果
GitHub Trending
claude-code (2.1k⭐), codex (1.8k⭐), autogen (1.2k⭐)
Hacker News
Google-Anthropic $40B (452pts), GPT-5 rumors (389pts)
Papers With Code
MoE Routing 98.2%, RAG Long-context benchmark

三个源汇总到 daily_tech_roundup.txt总耗时 0.9 秒

手动做:打开三个网页、复制粘贴、排版——至少 10 分钟。这是 AI Agent 对人类的降维打击:人类注意力是单线程的,GA 可以同时做 N 件事。

「我说’同时查3个站’,GA开了3个子代理,0.9秒收工。手动至少10分钟。并行才是Agent真正的生产力革命。」


Day 7:自主模式——合上盖子,让它自己干活

最后一天,我在 TODO.txt里写了三件事:

1. 检查 temp/ 目录是否整洁2. 验证 hackernews_top10.csv 是否完整3. 生成 daily_log.txt 记录完成情况

然后,我合上笔记本电脑,去吃饭。

GA 的「自主模式」是一条完整的自动流水线:读 TODO → 拆解 → 执行 → 写报告。只要电脑没关机,它就能自己干活。

半小时后回来,打开 daily_log.txt

✅ Task 1: temp/ organized — 74 files into 8 categories✅ Task 2: CSV validated — 10 rows, file intact✅ Task 3: log generatedTotal: 0.8s | Status: ALL DONE

三条任务,全部完成,0.8 秒。

那一刻我理解了什么叫「合上盖子,让 AI 上班」。

「我在TODO里写了3件事,合上电脑去吃饭。回来daily_log.txt已经躺着了,3件事全做完,0.8秒。那一刻我理解了什么叫合上盖子让AI上班。」


7 天总结:GA 到底改变了什么?

天数
任务
耗时
核心能力
Day 1
文件整理
<1s
文件系统操作
Day 2
搜索+摘要
9s
信息检索+筛选
Day 3
浏览器自动化
1.6s
网页抓取+结构化
Day 4
Bot接入
需人工扫码(诚实记录)
Day 5
定时任务
脚本+cron自动化
Day 6
并行处理
0.9s
子代理并行
Day 7
自主模式
0.8s
无人值守全自动

7 天前,我问:「它能干嘛?」

7 天后,我的答案:它能干我 80% 的重复性工作,而且干得比我快 10 倍以上。剩下的 20%,是需要我肉身出马的事。

但最关键的变化不是效率——是心态

以前,整理文件、抓数据、查新闻,要「专门找时间做」。现在,对 GA 说一句话就够了。任务从「要不要做」变成了「已经做了」。

AI Agent 的价值不是替代你,是把你从「要不要做」的纠结里解放出来。


你也能开始

  1. 装 GA:git clone https://github.com/datawhalechina/hello-generic-agent
  2. 配模型:在 mykey.py填 API Key
  3. 开口说:python launch.pyw,第一天就说「帮我把桌面文件整理一下」

不需要会写代码。只需要会打字。


💬 你驯养过 AI Agent 吗?你的「Day 7」是什么体验?评论区聊聊。

👇 下一篇预告:给 AI 装上眼睛——OCR + 视觉能力解锁全攻略