(虽然我现在才开始说 Agent,甚至显得老气了——那不是因为我鸽得久嘛)

从偏见说起
几个月前,我瞧不上盲目跟风”养虾”的那帮人,丝毫没有深入去了解,因此错过了尝试 Agent 的最好时机。人还是不能陷入二极管的思维。
新的工具或概念提出之初,不深入了解就下判断,只会让自己站在门外。我那时一直以为”龙虾”这种 AI 工具是个噱头——确实,无良自媒体拿信息差蒙人,但这是表象。背后是一条更长的线:新的工具从提出,到前沿小规模测试,到形成可发布的完整产品,激起轩然大波,而后才是真正的普及与融入生活。 这些工具融入更广泛的行业与领域,得到广大群众的实践检验,因而有了新的发展动力,变成前沿开发者的新的点子。
早期对话和角色扮演软件有点风头的时候,我们并不能预料到,网页对话在今日会完全成为日常生活的一部分——豆包和 DeepSeek 已经是全网的”基础设施”了。而在今日,模型的各项性能不断提高,这驱使着新工具的提出与开发。我们完全有理由畅想:在不远的将来,明年甚至是今年年底,使用 Agent 应该像吃饭喝水摸鱼一样,完全融入到更广泛人群的生活中去。
热潮与回落:一个规律
以前听过这么一个说法:互联网的热点是很难捉摸的。一个名不见经传的事物因为什么特点突然走红,被扬起到很高的位置,之后不可避免要下滑——没有事物能一下子就经得起全网这么混乱的考验。但这并非跌回原位,而是落到了一个更符合它走红特点的、稍高一些的位置。
前一段时间的淄博烧烤,热得全网巴不得明天就进淄赶烤,现在没有那样的热度了——难道是烧烤不好吃了?并非,只是它本应该十里八乡闻名,从全国闻名的热潮中缩回去而已。
“龙虾”也是如此。新生事物招来”传销”——说 Agent 是新的 AI 时代的入场券,有一定道理,但给老头老太太讲、给不熟悉技术的人讲,那就很没有道理了。然后三人成虎,到处是噱头,给我整的反倒对它没有好印象。从养虾热潮过去快一年了,我推测 Agent 应该已经是基本工具而非赶时髦。掌握新工具,降本增效(增效确实有,真降本了吗),这应该是一般大学生的义务——研究新工具,成为新青年。
“危险品”还是”有缺陷的工具”
对于 Agent 来说,一个完整的框架本来就应该包含本地文件读取和各种与电脑相关的功能。几个月之前,我们对”龙虾”误删本地文件感到惊叹,更多的是把它当危险品来看,而不是完整了解这个工具。
明白它有安全隐患,指着它说是”危险品”而不是一个”有缺陷的工具”——这是一个方向很偏的误认。因为前者导向固步自封,而后者导向对新工具的适应与开发。
Agent 到底是什么
不要把”龙虾”想象成动物。Agent 是给大模型装载的外部工具,类同脚手架(Agent 英文原意即”代理人”)。如果不用这个框架,你与大模型的交流就只是在网页端发消息,多的再提供一些图片、代码之类;而如果改用 Agent,这个框架给模型提供了一些写好的工具和 Skill,模型可以通过它提供的工具,主动获取其他信息。
还是有些抽象。不妨设想——有一个盒装的语音助手,摆在那只能语音聊天。但如果你把它装在一个扫地机器人上面,与这个小盒约定好:输出标准的”向前”,程序就会翻译这个消息,让扫地机器人驮着它向前;同理,装个摄像头,让语音助手输出”look”之类的内容,程序就会让摄像头拍照,把照片转给它(我们假设这个语音助手的模型,欸,它能分析图片)。这样,语音助手使用工具”看见”外部环境,就可以自己去探索周边的环境。
现在,电脑或者其他设备存储的内容就是这个”外部环境”,而 Agent 就是上文所说的中转程序——大模型通过 Agent,可以获取本地的内容,或者通过网络工具去搜索。这大概是我能想到的 Agent 最简单的解释了。
(话说如果真有电机和开发板的话,确实可以做一个扫地机器人驮着大模型跑的小玩意——至少原理并不复杂。)
用上了有什么好处
新的框架带来的丰富工具,能够让模型自己去看各种文档——这是纯对话复制粘贴所不能企及的:
·文档读取:让模型自己浏览长文档,不用你一段一段粘贴
·网络搜索:用浏览器工具让模型自己去搜索关键词,能快速获取大量相关信息,而人用语言描述,信息密度要低得多
·终端执行:让大模型使用终端,自己运行命令,甚至能独立调试软件源码——这超出了原有 Vibe Coding 的功能
·文件读写:直接读写本地文件,懒狗就一个字都不用自己写
最为根本的一点:模型通过这些工具能够掌握任务的全貌,而打字描述常常漏掉关键信息。使用 Agent,就可以极大提高它的建议的可行性,或者让它自己去执行。
“养虾”这个说法的不合理之处
现在,“养虾”这种说法的不合理之处就很明显了。OpenClaw 没有特别好用的长期记忆,它只是第一个在国内广为流传的 Agent。叫这个名字,大抵是希望模型能像用虾钳一样把其他文件抓过去——现在看来,这在 Agent 中是基本操作了。
怎么获取
这么好用的工具,要怎么获取呢?按预算分三档:
有钱的,可以购买一些厂商做的产品,比如阿里推出的 Qoderwork,基本上会员到位啥都到位。
不准备买会员、要一些自由度的,OpenClaw 和 Hermes Agent 可以说是这个领域公开最先进的工具了。它们本身都是开源框架,安装和配置会有一些步骤,能在网页端问问 AI 也可以得到十分详细的安装流程。另外,回忆一下上文那个语音助手的例子——程序都是免费的,但是模型(语音助手)不是。摸爬滚打半天之后,我建议你去给 deepseek 开放平台 充十块钱(五块钱都行),然后问问网页版的 DeepSeek 这玩意怎么连接 Agent 工具,之后你就会有一个国内顶配的 AI 工具能用。(别跟我说 Gemini、Claude 之类的,你都会这些了还用我教?)
一分钱都不想花但就想试试的,我推荐 MiniMax Agent(我没收到广告费)。这个软件下载安装包就直接用,本地写代码、改文档,免费版的功能也算全面,可以说是入门体验的极佳选择。
写在最后
Agent 只是 AI 工具的又一个发展阶段而已,采用新的工具一直都是降本增效的好方法。只是有一点——AI 对话的普及是免费的,但 Agent 及以后的工具会普及到免费的程度吗?我感觉有点困难。
但是你 DeepSeek 已经便宜得跟不要钱一样了。
这两天在研究拿安卓设备运行,我在termux装了个llama.cpp
之后AI写个运行脚本,一打开,我的平板崩了

夜雨聆风