导语
前段时间,社交媒体上流传过一个很小、但很有象征意义的案例:有人让一个基于 Codex 的 AI 代理去赚 5 美元。
最后,它没有停在聊天框里的赚钱方案,而是真的找到一个开源安全/审计赏金任务,提交修复 PR,跟进维护者反馈,拿到一笔 16.88 美元的付款。

这笔钱本身不是重点。更有意思的是:这一次,有人真的愿意为 AI 完成的任务付钱。
如果 AI 已经能自己找任务、提交结果、拿到钱,下一步问题就变成:它能不能进入更多真实工作流程?
当它开始进入选题、资料整理、发布检查和复盘这些环节,个人和小团队要面对的就不只是“能不能用 AI 提效”,而是哪些工作可以放心交出去,哪些判断仍必须由人负责。
这条新闻值得写的地方,已经不在 16.88 美元本身。它让一个原本有点遥远的问题变具体了:
AI 已经开始把某些任务做成可以提交、可以审核、可以付款的结果。 可它离让人放心交出一整段工作流程,还差很长一段路。
这篇文章想讨论的,就是这段距离:一个能做事的 AI,到底怎样才算真的变成生产力?
这不是自动经营,只是一次任务拿到了回报
先别急着把这个案例理解成“AI 已经会自动经营业务”。
更准确地说,它揭示了另一件事:AI 代理已经能在一个边界很清楚的任务里,完成从发现问题、提交结果到获得小额回报的链路。
这个链路很重要,因为它第一次把 AI 的执行能力和真实收入接上了。
但它还不是一门生意。
一次安全赏金任务,和一个稳定赚钱系统之间,隔着很多东西:稳定的任务来源、可重复的成功率、可信的验收方式、责任归属、支付结算、成本控制,以及失败后的复盘机制。

这也是为什么类似案例既值得兴奋,也不能夸大。
它最重要的数字不是 16.88 美元,而是“大于零”。 只要 AI 代理能完成一条有报酬的任务链路,某些工作就开始可以被拆成机器可执行、市场可定价、人工可验收的小单元。
但要让它每个月稳定产出一两万元,问题就完全不同了。
那不再是“AI 会不会做一次任务”,而是“这套系统能不能持续找到值得做的任务,持续交付合格结果,持续获得信任,并且把每一次反馈变成下一次改进”。
这就是一次执行和一套生产力系统的区别。
真正先变化的,是人怎么把任务交出去
如果 AI 代理要从演示走向真实生产,第一道门槛不是模型会不会回答,而是人能不能把任务交代清楚。
很多人现在用 AI,习惯写一句:“帮我做个方案”“帮我整理一下”“帮我优化这段内容”。这种说法适合聊天,不适合派活。
交给 AI 代理的任务,最好说清楚五件事:
目标是什么。比如不是“优化文章”,而是“把这篇文章从工具介绍改成一个有真实问题感的观点稿”。
材料在哪里。比如参考哪些官方资料、哪些本地草稿、哪些历史复盘,哪些资料只能做背景,不能写成事实。
限制是什么。比如不能夸大 AI 能力,不能写成鸡血文,不能把真实使用感受磨成平均稿。
完成标准是什么。比如标题要有冲突,导语要有具体场景,正文要有可复用判断,结尾不能只说“值得关注”。
什么时候必须停下来问人。比如出现几个可写方向时,不能替人直接拍板;涉及事实不确定时,不能顺手补一个听起来合理的说法;发现主线偏了,要先回来确认。

这不是写 prompt 的小技巧,而是把一件事交出去的能力。
AI 会把模糊放大。你交代得越模糊,它越容易跑偏;你验收标准越空,它越容易给你一个看起来完整、实际不能用的结果。
反过来,如果一件事已经被整理成清楚的目标、材料、边界、暂停节点和验收标准,AI 就更容易接住执行部分。
这时,AI 的价值不只是“替你多干点活”,而是逼你把工作本身整理成可委派、可检查、可复用的形态。
为什么一篇文章不能直接全交给 AI
这件事放到公众号写作里,会特别明显。
现在让 AI 写一篇文章并不难。它可以搜资料、搭结构、写初稿、改句子、整理配图、做预览、跑检查。很多以前消耗人的环节,确实可以交给它。
但直接把整篇文章扔给 AI,经常会得到一种很熟悉的结果:每个字都能看懂,结构也完整,表达也顺,可就是读不下去。
原因不是 AI 不会写字,而是它很容易绕过真正的思考过程。
好文章往往不是从“请写一篇关于某某的文章”开始的。它通常先有一个真实困惑:我为什么在意这件事?我从自己的使用里看到了什么?这么多方向里,我为什么选这一条?我不再轻易相信什么?

如果一上来就让 AI 写完整稿,它会倾向于走最平滑的路径:先讲背景,再列功能,再讲影响,最后给一个稳妥结论。这样的文章不会错,但也很难让人停下来。
更好的方式,是先别急着写。先让 AI 提出几个思考方向,让人选择自己真正感兴趣的问题;再让 AI 查资料、补反方、找案例;然后继续发散,直到文章真正要回答的问题浮出来。
这个过程看起来慢,其实是在保护人的主体性。
AI 可以帮你把执行做得更快,但它不能替你承担“我到底怎么看”的责任。
至少现在还不能。
能不能持续,才是最难的一关
如果只是偶尔写出一篇好文章,AI 已经很有帮助。
但如果目标是让 AI 真的变成生产力,甚至持续带来收入,难点就不只是“这次写得好不好”。
难点在于:下一次还能不能保持质量。
今天能写,不代表明天还能写。 这篇像真人,不代表下一篇不变成模板稿。 这次查重了,不代表下次不漏。 今天你盯得紧,所以质量还行;如果你不再每一步都亲自盯着,它还能不能维持基本水准?
很多人会遇到一个很现实的问题:规则越写越多,但 AI 每次都像重新认识你。
你上次说过不要模板化,它下次又写成模板。你说要查重,它说查了,但没有留下记录。你说要先启发思考,它直接起草。你说要做母语顺读,最后只是口头说“读过了”。你说要复盘,复盘结果却没有进入下一轮。
问题不在于规则不够多,而在于规则没有进入执行现场。
所以真正有用的工作流,不是一份越写越长的说明书,而是几件能在现场起作用的东西。
原则要少。比如解释优先、不要写平均稿、不要跳过人的判断。原则太多,AI 只会把它当成背景噪音。
步骤要固定。先发散方向,再让人选择;先查资料、定契约,再写初稿、做预览、跑检查。顺序稳定了,AI 才不会每次都重新摸索。
证据要留下。查过哪些资料,要有出处记录;为什么选这个方向、怎么定结构,要有过程记录;正文和插图放在一起是什么效果,要有预览。这样人才能回头检查:AI 到底做了什么,哪里没做完,下一轮该怎么改。
闸门要真能拦住。没有用户选方向,就不能起草;没有出处,就不能写事实判断;没有预览和质检,就不能说可发布。

这不只是个人写公众号会遇到的问题。放到公司里,AI 代理跑得越多,同样会遇到谁来评估、谁来更新流程、成功经验怎么沉淀的问题。
Microsoft 2026 年工作趋势报告里也提到一个相近的提醒:Agent 执行得越多,人类评估就越重要。组织需要回答谁来评估 Agent 的表现,谁有权更新 Agent 跑的工作流,局部成功怎么被捕捉并扩展成组织经验。
这句话放到个人身上也成立。
如果一个人想用 AI 做公众号、做数据分析、做自动化小工具,要建立的不是一堆提示词,而是一条能留下证据、接受反馈、修正下一轮的生产线。
这样,AI 才不会只是这次帮你省了两小时、下次又重新开始。它会慢慢变成一套越用越懂你的工作方法。
AI 最先接手的,是那些容易验收的工作
要理解这一点,可以先看代码为什么会成为 AI 代理最早成熟的场景之一:它的目标、材料和验收方式都相对清楚。
代码有文件、有版本、有测试、有报错、有差异对比,也有明确的验收方式。AI 做完以后,人可以看改了什么、测试有没有过、问题有没有复现。
很多知识工作也会沿着这条路走,只是验收方式更难。
产品经理可以让代理先读用户反馈、历史需求和竞品页面,整理出需求草案;运营可以让代理每天跟踪数据波动,标出异常和可能原因;销售可以让代理根据邮件、会议纪要和客户资料,准备下一次拜访简报;创作者可以让代理整理资料、标出引用来源、生成几个不同角度的开头。
个人内容生产也是一样。
一个月前,你可能还没有认真想过自己会做一个公众号。现在,在 AI 和 Agent 工具的帮助下,一个人已经可以搭起一条过去像小团队才有的内容链路:选题池、资料核实、初稿、配图、预览、质检、数据复盘、规则更新。

这就是生产力边界正在变宽的地方。
但它不是魔法。它更像一个小型工作室被压缩到一个人的桌面上:AI 负责大量执行,人负责方向、判断、品味、验收和系统迭代。
对普通人来说,不一定要记住每个英文产品名。更重要的是看清一个共同方向:以后越来越多软件都会多出一层“替你跑任务”的能力。
当这层能力出现,个人生产力会被重新打开。
以前一个人想做公众号、做数据产品、做自动化工具、做研究报告,往往卡在执行量太大。现在,一部分资料整理、草稿生成、预览检查和复盘记录可以交给 AI。真正的瓶颈开始变成:你有没有一个清楚的问题,有没有一条跑得下去的流程,有没有从反馈里持续变好的能力。
判断 AI 能不能成为生产力,看四个问题
以后再看到某个 AI 工具说自己能替你完成任务,不妨先问四个问题。
第一,能交代吗?
如果一个任务必须靠你反复口头补充,材料散在各处,目标经常变化,那就不要急着让代理自动跑。先把任务说明、资料入口和完成标准整理清楚。
第二,能看见吗?
代理在后台做事时,你能不能看到它读了什么、改了什么、为什么这么做?如果只有一个最终答案,没有过程、来源和差异,就很难验收。
第三,能停下吗?
涉及外部客户、钱、合同、正式发布、系统改动时,它能不能在关键节点停下来等你确认?不能停的自动化,不适合放进高风险流程。
第四,会变好吗?
它做完一轮以后,能不能根据数据、反馈和人工判断修正下一轮?如果每次都是重新来过,那它只是自动执行;如果它能把经验写回流程,才开始接近真正的生产力系统。

这四句话也能反过来检查人自己的工作:任务是否清楚,过程是否透明,风险是否可暂停,结果是否会推动下一轮变好。
如果答案都是否定的,问题可能不在 AI 不够强,而在工作本身还没有被整理成可委派、可验收、可迭代的形态。
最后的判断:自动赚钱之前,先出现的是小型 AI 工作室
16.88 美元不是终点,更像一个起点。
它说明 AI 代理已经能把某些小任务做成可提交、可审核、可付款的结果。但短期内,它不会直接把人从工作里完全解放出来,也不会自动替人经营一门生意。
更现实的变化是:人会从一线执行者,变成一间小型 AI 工作室的主编、调度者和验收人。
主编负责判断什么值得写,什么不值得写。 调度者负责把任务交代清楚,决定哪些可以自动跑,哪些必须停下来问人。 验收人负责看结果有没有事实问题、表达问题、方向问题,以及下一轮要怎么变好。
这听起来没有“AI 自动赚钱”那么轻松,但它已经是很大的变化。
因为过去,一个人想做出稳定内容、数据分析、工具开发或研究产品,常常需要一个小团队。现在,一个人只要能设计好流程,就有机会调度多个 AI 承担执行,把自己从低价值劳动里释放出来。
成熟的 AI 生产力,不会只表现为“它写出了一篇文章”或“它赚到一笔小钱”。更要看的是:你把任务交出去以后,第二天能看到它查了什么、做了什么、哪里不确定、哪些结果需要你确认、下一轮准备怎么改。
到那一天,AI 才不只是一个很会干杂活的助手,而更像一套能被人管理、能持续增长的工作机器。
但在那之前,人更不能停止思考。
真正让人自由的,不是 AI 突然替你赚钱,而是你终于有能力把一件事做成不用天天盯着也能向前走的系统。
到那时,人不是退出工作,而是从低价值消耗里退出来,把注意力放回问题、取舍、品味和系统本身。
这才是 AI 从工具变成生产力的真正距离。
参考来源:
1. Digg:Codex-based AI agent earns $16.88 security bounty
2. Startup Fortune:Codex turns a $5 security bounty into a bigger signal
3. OpenAI:Work with Codex from anywhere
4. OpenAI:OpenAI and Dell Technologies partner to bring Codex to hybrid and on-premises enterprise environments
5. OpenAI:Codex for (almost) everything
6. Anthropic Claude Code Docs:Continue local sessions from any device with Remote Control
7. Microsoft WorkLab:Agents, human agency, and the opportunity for organizations
8. Google:Search I/O 2026 updates: AI agents and more
如果这篇文章帮你少花一点时间看懂 AI 变化,欢迎点个赞、转发给需要的人,也可以点个在看。
有想法也欢迎在评论区聊聊。点关注,不迷路;点亮星标,锁定 AI 热点极速推送。

夜雨聆风