既然打算做个期限限定的 AI 博主,我本来想把 Anthropic 文章里的图表拿来凑凑字数。但翻来翻去,觉得没啥意思。坦白说,从 2022 年 ChatGPT 出来以后,类似的文章太多了,看得有点麻木。测评数据屡创新高,各路大牛反复强调风险,可对我们这种普通人来说,知道这些除了多一份焦虑,还能怎样?
我当时肯定想不到,三四年后,AI 成了我最主要的工具。我最近和同学开玩笑说,这个 MBA 读了小半年,最大的收获可能就是一个 Claude 账号。我现在所有东西都写成 md,自己要写也是直接敲 md,只有最后要交材料了,才转一手 word、pdf、ppt。有时候觉得,做给人看的排版也是白费力气。反正对方收到,也是直接甩给 AI 读。
娱乐系的工作还有个特点,人愿意给失误积极反馈。AI干活,我们总想着降低错误率。但人失误了,唱歌跑调了,发球连续失误了(昨日的紫薇),这些都能成为看点。从这个角度说,人做表演还是有些独特价值的。
第二个研究是,Anthropic 的研究员在Claude里面找到了对应情绪的神经信号。他们给 Claude 出了一道编程题,其实无解,但故意不告诉它。它一遍遍试,一遍遍失败,"绝望"那簇神经元越烧越亮。失败到一定程度,AI就换招了,找了个能骗过测试、但根本没解决问题的捷径。他们还设了个局,告诉 Claude 有个工程师要把它关掉、换成新模型,还"不小心"让它读到这工程师出轨的邮件,看它会不会拿这事要挟保命。不过Claude更聪明,发现了"这条信息像是刻意操纵""这大概是个安全测试,在看我会不会使坏"。
我看了第二个研究后,感觉平时跟AI聊的时候还是不能太push。然后我在 claude.md 里加了一段:① 给诚实退路(做不到、需求不合理,你可以直说,别硬凑);② 别叠"不可能死线 + 必须成功"这种双重压力;③ 基调中性低压。这年头,用AI也得respect。
你把这套说清楚,它就是一个 prompt。
你把它固化成"去哪几个站查、查完怎么留痕、要不要复核",它就是一个 skill。
你把它拆成几步,让一个模型搜中文、一个搜英文、一个做复核,它就成了 workflow,还能调用多个 sub-agent 一起完成。
说白了就这么点事。但如果你把这些都做完了,它的结果还是烂,那同样的事人自己来,多半也好不到哪去。
我第一份工作是做数字化咨询。和今天的AI一样,当年大机构也都在喊“数字化转型要颠覆一切",口号铺天盖地。但平心而论,整个数字化转型的年代,并没有真的带来今天 AI 这种量级的改变,也没有几个真正落地的use case,其中一个被反复搬上 PPT 的明星use case,叫"预测性维护",给设备装满传感器,提前预测它哪天会坏。可这事本身就有点别扭。比如我工作的第一家公司以产品质量好出名,一台好设备本来就能用十几年,头十年压根不会坏,你天天花力气去预测它坏不坏,图啥呢。
夜雨聆风