去年10月份,我一个朋友跟我说,现在有个叫Agent的东西特别牛。我当时心想,又是啥新名词?查资料、试产品,折腾了两三个月才搞明白。没那么玄乎。
Agent到底是什么?别被名字吓到了
你用过导航软件吧。输入目的地,它给你规划路线,遇到堵车自动换路,到了地方提醒你下车。这其实就是最简单的Agent,一个能自己动脑子、自己干活、自己解决问题的程序。
但现在的AI Agent比这聪明多了。
ChatGPT你用过吧。你跟它说话,它回答你。但ChatGPT本质上是个问答机,你问一句,它答一句,对话结束就完了。它不会主动去做什么,也不会记住之前的对话去干别的。
Agent不一样。Agent是有手的。
你告诉Agent,帮我订一张明天去上海的机票,要早上出发,价格别超过800块。
它会怎么做。
不是只给你一堆建议,而是真的去查航班、比价格、看时间,最后把订单信息发给你确认。你说再等等看,它还会设置提醒,等价格降了再通知你。
这就是Agent的核心。不只是聊天,而是能动手帮你把事情办了。
Agent是怎么干活的
很多人一听技术原理就头疼,但其实Agent的工作逻辑挺直观的。
Agent干活分几个环节。首先是理解你的意图。你说帮我写个周报,它得知道你是要工作总结,还是要项目汇报,还是要数据统计。这一步跟ChatGPT差不多,靠大语言模型来理解你说的话。
然后是拆解任务。这是Agent最厉害的地方。它不会一上来就瞎写,而是先想,写周报需要啥信息。得去邮箱翻这周的工作邮件,得去项目管理工具看看任务进度,得去日历确认会议记录。然后列个清单,先干啥,后干啥。
这个过程其实挺像人脑的工作方式。你自己写周报的时候,是不是也得先回忆一下这周干了啥。Agent做的就是这个事,只不过它不用回忆,而是直接去翻数据。
最后就是动手执行。计划定好了,Agent就开始干活了。去邮箱搜邮件,去钉钉或飞书查任务,把信息汇总起来,写成周报草稿。中间发现数据对不上,还会回头再查一遍,直到把事情办妥。
这里有个细节挺有意思。Agent在执行过程中,如果遇到问题,它会自己想办法解决。比如它去翻邮件,发现某个项目的进度邮件没找到,它会换个关键词再搜一次,或者去项目管理工具里查。
整个过程,你基本不用管。等它干完了,给你发条消息,周报写好了,你看一下有没有要改的。
Agent和普通AI工具,到底差在哪
我知道你可能还是不太清楚Agent和ChatGPT、文心一言这些工具有啥区别。我用几个实际场景对比一下,差距就明显了。
做市场调研。
用普通AI工具,你问帮我分析一下新能源汽车市场,它给你一段文字总结,信息来源不明,数据可能还是两年前的。
用Agent,你说帮我做一份新能源汽车市场调研报告,要最新的销量数据、主要玩家分析、未来趋势预测。Agent会去搜最新的行业报告、爬公开数据、整理竞品信息,最后给你一份带图表、有数据来源的完整报告。
安排会议。
用普通AI工具,你问下周三下午3点开会合适吗,它回答需要看参与人的日程安排,然后就没下文了。
用Agent,你说帮我约下周三下午3点的项目评审会,参会人小张、小李、小王。Agent会去查三个人的日历,找大家都有空的时间段,发会议邀请,订会议室,提前一天再提醒。有人临时有事,它还会自动协调改时间。
写代码。
用普通AI工具,你贴一段代码问这段代码有什么问题,它给你指出bug,告诉你怎么改。
用Agent,你说帮我写一个用户登录功能,要支持手机号验证码登录,还要做防刷限制。Agent会自己设计接口、写代码、写测试用例、跑测试,发现报错了自己改,直到功能跑通。最后把代码提交到GitHub,给你发个链接。
处理邮件。
用普通AI工具,你把邮件内容贴给它,问这封邮件怎么回复,它给你写个回复草稿。
用Agent,你说帮我处理一下今天的邮件,重要的标记出来,垃圾邮件直接删,需要回复的按优先级排好序,顺便把会议邀请都加到日历里。Agent会一封一封看,自动分类、自动归档、自动回复简单的询问,把复杂需要人工处理的标出来等你过目。
看出区别了吗。
普通AI工具是顾问,给你建议,但不干活。Agent是助理,你说一声,它把事办了。
现在有哪些Agent能用?我帮你试了试
说到这儿,你可能想问,那现在市面上有哪些Agent可以用。我挑几个我实际用过的给你说说。
Claude的Computer Use。Anthropic推出的这个功能,我上个月刚拿到内测。第一次用的时候挺震撼的,我让它帮我整理一份销售数据表,它就真的自己打开了Excel,把乱七八糟的数据分类汇总,还顺手生成了图表。整个过程我就坐在旁边看着,像个监工似的。
OpenAI的Operator。这是OpenAI今年1月发布的,我试了一下订餐厅的功能。当时我说帮我订一家周五晚上7点的意大利餐厅,要评分4.5以上,离我公司不超过5公里,它真的去OpenTable上搜了一圈,找到三家符合条件的,把评分、距离、菜单链接都列出来让我选。我点了确认,它才完成预订。这体验,说实话,比我助理还细心。
国内的Manus。这个前几天在朋友圈刷屏了,号称全球首款通用Agent。我排了三天队才拿到内测资格。第一次用是让它帮我做2024年AI行业投融资分析,我本以为就是搜几篇新闻稿,结果它真的去翻了Crunchbase、IT桔子、36氪等十几个数据源,整理了一份28页的报告,还带趋势图。虽然里面有些数据需要我核实,但整体框架已经挺完整了。
除了这些通用型的,还有一些专门干一件事的。比如Devin专门写代码,Julius专门做数据分析,Shortwave专门管邮件。
Devin我用的次数不多,主要是让它写一些Python脚本。速度确实比我快,但代码风格我得调,有时候变量命名也不太符合我的习惯。
Julius做图表挺好看的,配色和排版都很专业。但数据源得自己确认,它不会帮你验证数据对不对。
Shortwave帮我过滤垃圾邮件挺准的,基本不会把重要邮件错标为垃圾邮件。但重要邮件还是得自己过一遍,不能完全依赖它。
各有优缺点吧,看你需要啥。
普通人怎么用Agent
看完上面这些,你可能想问,那到底该怎么用。我自己也是踩坑踩出来的,分享几点心得。
刚开始别太贪心。我第一次就让Agent帮我写行业报告,结果出来的根本没法用。后来学乖了,先从简单的来,查个公司信息、翻译个邮件、整理个表格。等摸清它脾气了,再慢慢加大难度。
信息给够。Agent再聪明,也不知道你心里想啥。你得告诉它:要达到啥目的、有啥限制、想要啥格式。同一件事,我第一次说得糊里糊涂,出来的完全不对。第二次拆细了说,效果立竿见影。
别当甩手掌柜。Agent能干活,但不是啥都干得对。特别是重要的事,你得盯着。我让它帮我回一封重要邮件,差点把价格说错了,好在看了。
多试试不同的Agent。各有各的长处,有的写代码厉害,有的查资料强,有的处理邮件在行。根据你的需要选合适的。我现在就是,写代码找Devin,做分析用Manus,各用各的。
别急。Agent还在发育期,偶尔会犯傻,或者理解错你的意思。换个说法再试一次,或者把任务拆碎点。技术更新快得很,说不定下个月这些问题就没了。
Agent的未来会怎样
我长期关注AI行业,对Agent的发展有几个猜测,不一定准。
一个趋势是Agent会越来越懂你。现在你还得告诉它要啥将来它可能提前就帮你准备好了。比如你最近在查某个项目的信息,它默默帮你整理份背景资料。比如你日历里有个重要会议,它提前把相关材料放你桌上。已经有点苗头了。
还有个有意思的场景是Agent互相配合。将来你有一个主Agent,它会自己叫其他专门的Agent来帮忙。要做新产品发布?主Agent叫设计Agent做海报,叫文案Agent写宣传,叫数据分析Agent预测市场,最后汇总给你。三五年内大概就能实现。
最关键的问题是,当Agent越来越聪明,你可能根本分不清哪些是人干的、哪些是Agent干的。那人的价值在哪?
我觉得,Agent能替你干活,但替不了你思考。它帮你搜信息、整理数据、写初稿,但最终决定还得你来做。Agent是放大器,放大你的能力,不是替代你。
说白了就像请了个实习生。跑腿、查资料、做表格它都行,但大方向你得把控。让它搜一百篇论文,哪篇值得细读还得你来判断。让它写个初稿,最终发不发你拍板。
这种人机协作,就是未来工作的常态。
写在最后
Agent这东西,说白了就是个能听懂你说啥、能自己规划怎么干、能动手把事办了的程序。它不是聊天机器人,也不是搜索引擎,而是真正能帮你干活的数字助理。
现在的Agent还不够完美,有时候会出错,有时候理解不了太复杂的指令。但这个方向是对的,发展也很快。可能再过一两年,每个人手机里都会有一个Agent,像微信、支付宝一样成为基础设施。
站在通用人工智能前夜,读懂每一次AI进化。
夜雨聆风