乐于分享
好东西不私藏

当AI自己给自己造工具:从Claude Code聊起

当AI自己给自己造工具:从Claude Code聊起

(摄于 巴黎)

去年manus发布的时候,写了这篇文章,碎碎念了 给AI造工具的事儿。

当AI成为未来工具的第一用户:从manus爆火聊起

整整一年过去了。喏,OpenClaw,火出天际。

甚至连我晚上在家常用的工具都变成了 Claude Cowork,还拉起了自己的git。

二狗也开始说:我不是人了,我是人肉API Gateway。

这几天,[App会消失] 这个话题,也甚嚣尘上,Sam也出来都发帖。

什么地步呢?首评的工程师回答了:那当然“our jobs being taken away”.

一年过去了,貌似当初那篇文章里的设想,已经初见端倪。

工具的控制权,在慢慢往AI手中过渡。

一,模型本能的想用工具

最近对Boris很感兴趣,看了好几个它的访谈。其中有一个The Pragmatic Engineer Podcast的访谈,非常详实—-Building Claude Code with Boris Cherny。

Boris提到了一个Aha moment。刚开始时,他给Claude随便接入了一个bash工具。然后他问了一个问题:我现在在听什么歌?

Claude没有说 “我不知道,我无法访问你的本地信息”。它写了一个AppleScript,查询了Mac的音乐播放器,把答案告诉了Boris。

没有人告诉它可以用AppleScript去读Mac的状态。它自己判断:这个问题需要这个工具,我来用。

Boris在说到这个点时,使用了一个非常微妙的词“inherently want”

模型就是用工具,本能的想用。

你给bash,它就写AppleScript;你给文件系统权限,它就自己顺着import去挖代码库。

不敢想,这种工具饥渴一旦释放,是不是根本停不下来?

二,AI给自己造工具呢?

现在,Anthropic整个公司,约80%的代码由Claude完成。

而,创造Claude code的人Boris,已经两个多月没有手写过一行代码了。他每天发出20多个PR,每一个,都100%由Claude code完成。

Claude Code自己在写自己。

AI有主动使用工具的本能,也有这个能力,也更高效。就自己造呗。

所以慢慢的,这个本能生根发芽,开始社会性运转。

1,自己做skill,自己优化

比如Claude写的那个AppleScript,如果他发现,这个任务反复出现,它把这个有效的逻辑封装成可复用的Skill,存进工具库,下次直接激活。

不需要人来触发这个动作,它自己决定。

现在Boris团队维护了一个叫 CLAUDE.md 的文件,每次发现Claude做错了什么,就把规则加进去,让它下次不再犯同样的错误。

迟早,这个判断和动作,会由AI自己来做。

AI在每次使用某个工具之后,记录效果。积累足够样本,发现这个工具在某类场景下表现不够好,自动优化逻辑,写新版本,测试,替换。技术上没啥障碍。

2,AI有没有一个小社会?

一个AI造了个好工具,另一个AI为什么要重新造?

工具会在Agent之间流通。某个AI解决了一类问题,把工具注册进skill poll,其他AI执行任务时发现它,直接调用。工具开始像代码库一样被管理——有版本,有调用记录,有效果评分,有迭代历史。

怎么说呢,我们人类都想做Agent store来商业化,但是AI可以自己做一个skill store,来开源共享。

三,The Bitter Lesson

最近重读了 The Bitter Lesson。

“One thing that should be learned from the bitter lesson is the great power of general purpose methods

“We should build in only the meta-methods that can find and capture this arbitrary complexity”

所以AI给自己造工具,是否也是一种找最通用的自我扩展方式?

说到通用。我想起产品史上几个重要的时代级产品,也是“seek general methods“

乔布斯觉得用手指直接点击操作,是最原始最通用的,发明了 iPhone全屏幕手机;

抖音采用直接上下滑动的前台交互,最通用,开启短视频时代;

ChatGPT,就用对话框呗,毕竟LLM,人说话打字总会吧,最通用,开启Chat时代。

2024年,做Agent消费类的产品,有一段时间我非常不喜欢chat的交互,觉得对普通用户来说使用门槛非常高,我想要让它做一些任务时,一轮轮对话依然得不到自己想要的,气的骂AI蠢,可用性极低。

后来2025年,做Agent platform相关的产品,for building Agents,遇到一个问题:“如何方便通用的让用户提出自己的二次编辑需求?”,我甚至还提出了像乐高积木一样的可视化方案,让用户直接点击,表达你想改哪儿。

然而,想来想去发现还是自然语言最通用,还是得用Chat。

此时此刻,两年刚过,它已经几乎能对齐自然语言与计算机语言的理解了。

所以Chat没有错。错的是当时的模型还不够强,还撑不起这个交互。

每一个通用时刻,都有一个前提:底层能力刚好到位了。或者先设计出来,等着底层能力到位. 

比如手机的手指点击交互,需要屏幕足够精准;抖音的上下滑动,需要推荐算法足够准。

时机不到,通用会是过渡期的负担。时机到了,通用就是降维打击。

那下一个通用时刻,等的又是什么底层能力到位?下一个通用的交互又是什么?

我们无法期待乔布斯的天才时刻,可能需要反反复复的与AI进行交互,去试探,试出来了,那可能就开启新时代了。

四,做产品,依然需要用心

现在搭建一个给自己用的小App,已经非常容易了。

但人人都能造,意味着烂的东西会以更快的速度涌现,噪音反而变多了。

那些手感精巧的,能让人持续想用的,依然需要人的品味和判断。

用心,至少是一种态度。

彩蛋:

一直很喜欢Claude的图标和文字设计,看到有姐妹,整理了Claude的图标,赶紧保存下来了。

Claude一直采用的是,低饱和度的颜色+粗犷的线条,相比较御三家的其他两家,多了一些人文色彩。

陶土色,米色,浅卡其,浅墨绿…. 可以结合任何白色图形+黑色线条。

(图源:@mi)

(图源:@TreeWan)

晚安,卡卡,向前看。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 当AI自己给自己造工具:从Claude Code聊起

猜你喜欢

  • 暂无文章