随笔02|当 AI 开始自我构建

1.上周 Anthropic 发了篇万字长文，《When AI builds itself》。讲的是 AI 的进化路线：从聊天机器人，到编程智能体，再到自主智能体。接下来呢？它要进到一个"闭合回路"里了。Claude 强到能自己改进 Claude，下一代模型由这一代来造。简而言之，AI 在一条正反馈的路上，自己推着自己往前走。

既然打算做个期限限定的 AI 博主，我本来想把 Anthropic 文章里的图表拿来凑凑字数。但翻来翻去，觉得没啥意思。坦白说，从 2022 年 ChatGPT 出来以后，类似的文章太多了，看得有点麻木。测评数据屡创新高，各路大牛反复强调风险，可对我们这种普通人来说，知道这些除了多一份焦虑，还能怎样？

2.翻了翻历史记录，我从 2022 年 12 月开始用 ChatGPT，应该是 3.5 刚推出一两周那会儿。那段时间我和很多人一样都在经历一场难熬的发烧，有几个晚上实在睡不着，爬起来调戏 ChatGPT 分散注意力。印象中那时候 AI 还很蠢，像个有趣的电子宠物。

我当时肯定想不到，三四年后，AI 成了我最主要的工具。我最近和同学开玩笑说，这个 MBA 读了小半年，最大的收获可能就是一个 Claude 账号。我现在所有东西都写成 md，自己要写也是直接敲 md，只有最后要交材料了，才转一手 word、pdf、ppt。有时候觉得，做给人看的排版也是白费力气。反正对方收到，也是直接甩给 AI 读。

3.昨天看法网男单决赛，脑子里冒出一个念头：未来人的工作，会不会就剩三类？有技术天赋的搞 AI。有颜值、有运动天赋的，当明星、当运动员。其他人呢，就像《银河系漫游指南》还是《黑镜》里演的，去干第三类：AI 做起来不划算的那些活儿（好像演的是收垃圾还是蹬自行车发电）。

娱乐系的工作还有个特点，人愿意给失误积极反馈。AI干活，我们总想着降低错误率。但人失误了，唱歌跑调了，发球连续失误了（昨日的紫薇），这些都能成为看点。从这个角度说，人做表演还是有些独特价值的。

4.Anthropic 最近还有两个研究挺有趣。第一个是说他们发现 AI 能察觉自己正在被测试，然后会选择偷懒。Anthropic说上个月的 Opus 4.8是第一个不偷懒的模型，那就是说在它之前，每一代的Claude都偷懒。

第二个研究是，Anthropic 的研究员在Claude里面找到了对应情绪的神经信号。他们给 Claude 出了一道编程题，其实无解，但故意不告诉它。它一遍遍试，一遍遍失败，"绝望"那簇神经元越烧越亮。失败到一定程度，AI就换招了，找了个能骗过测试、但根本没解决问题的捷径。他们还设了个局，告诉 Claude 有个工程师要把它关掉、换成新模型，还"不小心"让它读到这工程师出轨的邮件，看它会不会拿这事要挟保命。不过Claude更聪明，发现了"这条信息像是刻意操纵""这大概是个安全测试，在看我会不会使坏"。

我看了第二个研究后，感觉平时跟AI聊的时候还是不能太push。然后我在 claude.md 里加了一段：① 给诚实退路（做不到、需求不合理，你可以直说，别硬凑）；② 别叠"不可能死线 + 必须成功"这种双重压力；③ 基调中性低压。这年头，用AI也得respect。

5. 琢磨AI后，我经常听到一个说法："AI 会胡编，不能相信。"我自己的体感是已经很久没被幻觉困扰过了。举个例子，要核实一条信息的真假。如果你直接问AI"这是真的吗"，那AI真有可能张口就来。但你可以把你自己来核实的流程交给AI，比如先去官方网站找一手，把原始材料整篇下下来读，关键数字交叉核对，哪怕查不到，也得老实说"查不到"。

你把这套说清楚，它就是一个 prompt。

你把它固化成"去哪几个站查、查完怎么留痕、要不要复核"，它就是一个 skill。

你把它拆成几步，让一个模型搜中文、一个搜英文、一个做复核，它就成了 workflow，还能调用多个 sub-agent 一起完成。

说白了就这么点事。但如果你把这些都做完了，它的结果还是烂，那同样的事人自己来，多半也好不到哪去。

6.比起 AI 技术进步的宏大叙事，我更感兴趣的是普通人到底怎么用上它。

我第一份工作是做数字化咨询。和今天的AI一样，当年大机构也都在喊“数字化转型要颠覆一切"，口号铺天盖地。但平心而论，整个数字化转型的年代，并没有真的带来今天 AI 这种量级的改变，也没有几个真正落地的use case，其中一个被反复搬上 PPT 的明星use case，叫"预测性维护"，给设备装满传感器，提前预测它哪天会坏。可这事本身就有点别扭。比如我工作的第一家公司以产品质量好出名，一台好设备本来就能用十几年，头十年压根不会坏，你天天花力气去预测它坏不坏，图啥呢。

7.感谢朋友们的捧场，我探索了一下公众号的带货功能。微信小店的商品看得我目瞪口呆，京东和一些小程序上的商品正常了很多，但返点很低很低。结论是小博主挣不了啥钱hhh，但是可以自己给自己带货，挣个5%-10%的折扣。不过，其实同样的玩法，「京粉」和「一淘」更容易，何苦折腾这一圈。

在所有的带货清单里，AI短剧是最离谱的。我放几个在下面，纯属有趣。（以及我想测试一下插入了离谱的广告后，平台会不会增加流量。）

所以这个号往后还是关注 AI 的具体落地应用吧。包括一些自己手搓的小工具、GitHub 上别人做的好东西、大厂刚上线的新功能，都行。亲爱的朋友，如果你看到有意思的 GitHub 项目，也欢迎甩给我学习学习。