当前时间: 2026-06-28 17:30:28
分类:办公文件
评论(0)
AI Agent怎么搭建?昨晚刷朋友圈,连着三条都是晒 Agent 跑通的截图,配文都带着点按捺不住的得意。点进去细看,大半是套了个开源框架,改了两行提示词,就算成了。也正常,这两年的科技圈,活像霞飞路上接连开张的时装店。每季都有新鲜名头摆进玻璃橱窗,亮闪闪地晃人眼睛。前阵子满街还在说大模型,转眼的工夫,橱窗里的海报就全换成了 Agent。字都是认得的,凑在一起,倒像洋行里的英文合同。看着热热闹闹人人都在聊,真要伸手去碰,总隔着一层毛玻璃,看不真切,也摸不着门道。很多人问,AI Agent 到底怎么搭。要花多少钱,要学多少东西,要踩多少坑。今天就掰开揉碎了说,全是实打实的干货,半句虚的都没有。搭个 Agent 到底要花多少钱?
先算一笔最实在的账。搭 Agent 不是养金丝雀,不是光看着好看就行,每天跑起来都是真金白银的开销。搁在 2025 年秋天,这事还不是普通人能碰的。那时候行业里做 Agent,默认底座选 GPT-4 Turbo,输入十美元百万 token,输出三十美元百万 token。按最普通的用量算,日均五百次交互,单次平均输入八百 token、输出三百 token。单是模型调用的费用,一个月折人民币就要七千八百块。这还没算向量数据库、云服务器、第三方工具接口的钱。那时候普通开发者提 Agent,都默认是公司项目,个人掏腰包玩的,多半是不差钱的技术爱好者,玩票性质居多。变化是从 2025 年年底开始的。十二月里,OpenAI 先动了手,把 GPT-3.5 Turbo 的价格砍了一大截。输入从每百万 token 零点五美元,降到零点一五美元;输出从一点五美元,降到零点六美元。我当时身边有个做独立开发的朋友,当天就把自己的小项目底座换了,说省下来的钱够他每个月多喝两箱冰可乐。那时候就有人开始动心思,用 3.5 的底座搭简易 Agent。成本直接落到原来的十分之一,一个月几百块就能跑起来。只是能力差了一截,就像穿惯了狐皮大衣的人,换了件夹棉的薄袄。暖和是还能暖和,真要拿去赴宴,终究是上不了台面。很多人那时候就说,这只是开始。果然,开了年,降价的潮水就一波接一波涌过来,连喘气的空隙都不给人留。2026 年一月,GPT-4o mini 正式上线商用。一出来就定了低价,输入零点零七五美元百万 token,输出零点三美元百万 token。还是按之前的用量算,同样的五百次日均调用,单月模型成本折人民币四百二十块。比起一年前的七千八,零头都不到了。二月里,Anthropic 紧跟着调价。Claude 3 Haiku 输入零点一美元百万 token,输出零点二五美元百万 token,长上下文版本只加两成溢价。两家海外厂商的价格,算是咬到了同一档。三月,国产模型跟上了最狠的一刀。DeepSeek V4 正式开放商用 API,输入零点零五元人民币每百万 token,输出零点一五元每百万 token。一百二十八 k 的上下文窗口,不加收任何费用。说出来很多人不信,我第一次看到价目表的时候,反复刷新了三次页面,以为是标错了小数点。同样的调用量拉满了算,一个月的模型开销,八十七块钱。没人想到能降到这个地步。就像永安公司里挂着的进口绸缎,头年还卖十几块大洋一匹,转过年来剪了标摆进折价部。摸上去还是一样的滑润光泽,价签上的数字已经薄得像层蝉翼,风一吹就能飘起来。五月里,价格再下一个台阶。豆包 Pro API 宣布调价,输入从每百万 token 零点零八元,降到零点零三元;输出从零点一二元,降到零点零六元,原生支持工具调用和记忆模块。同量级的调用量,月支出算下来不到四十块。一杯奶茶的钱,就能让一个 Agent 给你跑满一整个月。这话我跟一个做企业采购的朋友说过,他愣了半天,说还没他每月买打印纸的办公耗材钱贵。【成本跌得比上海的梅雨季还快】,一年时间,从七千八跌到四十。数字摆在这里,不用多说什么,人人都能算明白这中间的分量。坊间总有人等着抄底,看着价格一路往下走,反倒攥着钱不肯动了。总觉得下个月还能再降,再等等也不迟。这心思和换季时买衣裳的女人一模一样。盯着橱窗里的裙子,从上新看到打折,从打折看到清仓,总想着再便宜十块钱就下手。临了等到断码了,才发现自己喜欢的那款早就没了。一步步拆:Agent 到底是怎么搭起来的
账算清楚了,心里就有底了。再来说说手头上的活,到底怎么一步步把 Agent 搭起来。搭 Agent 不像搭积木,图纸摆出来,按颜色拼上就行。也不像包馄饨,皮裹着馅,捏紧了不漏汤就合格。它更像老裁缝做一件旗袍。量尺寸、选料子、滚边、上盘扣,每一步差个分毫,穿在身上就不是那个味道。先讲最核心的,底座选型。这就像旗袍的料子,是整个东西的根基。料子选得不对,后面针脚再细,也出不来好效果。别笑,真有人一上来就充钱开 GPT-4o 的接口,跑了三天账单出来,心疼得连夜换模型。这种事圈子里每个月都能听到几桩。现在市面上能用来搭 Agent 的模型,大大小小有几十款,掰着指头数,其实也就三档。第一档是顶配效果款。追求能力上限的,选 GPT-4o 或者 Claude 3 Opus。2026 年六月的现价,GPT-4o 输入五美元百万 token,输出十五美元;Claude 3 Opus 输入十五美元,输出七十五美元。这类模型适合做 To B 的付费项目,对准确率要求极高的场景。个人玩家很少碰,毕竟调用一次几块钱就没了,玩不起。第二档是平衡款,也是现在市面上的主流。GPT-4o mini、Claude 3 Sonnet、DeepSeek V4,算是三足鼎立。Claude 3 Sonnet 长文本处理最稳,处理几十万字的文档不容易乱,输入三美元百万 token,输出十五美元。GPT-4o mini 多模态能力强,图片、表格都认得准,生态也最完善。DeepSeek V4 中文理解最贴合国内用户,工具调用准确率比同价位模型高两成,价格只有前两者的几十分之一。没有绝对的好坏,全看你用来做什么。做外贸的选前两款顺手,做国内场景的,后者的性价比摆在这里,明眼人都算得过来。第三档是极致成本款。豆包 Pro、通义千问 Lite,还有本地部署的开源小模型。豆包 Pro 刚才算过,一个月几十块钱,普通场景完全够用。要是调用量特别大,又担心数据安全,本地部署个 Qwen 2.5 7B 模型,一张二手 3090 显卡就能跑起来。一次性硬件成本四千多,后续不用再掏一分钱 token 费。很多人一上来就想选最好的模型,其实大可不必。就像做日常穿的旗袍,没必要非用上等织锦缎。杭绸料子舒服耐穿,洗多少次都不变形,反倒更适合过日子。料子选好了,接下来要说的是记忆。Agent 好不好用,很大程度上看它记不记得住事。记性差的 Agent,你上一句刚说过自己是做电商的,下一句它就问你是做什么行业的。跟金鱼似的,转个身就忘,用着能把人憋出内伤。记忆分两种,短期的和长期的。短期记忆就是对话上下文,现在的模型基本都带 128k 以上的上下文窗口。简单的场景,直接把历史对话塞进去就行,不用额外折腾。几十轮对话下来,它都记得清清楚楚。长期记忆就麻烦一点。比如要记住用户一个月前说过的偏好,几百轮对话之前提过的需求。这时候就得用向量数据库。说起来也有意思,前两年向量数据库还是个独立赛道,融了不少钱,这才多久,就快成大模型的附送功能了。搁在 2025 年,做向量数据库基本都用 Pinecone。按存储量和查询次数收费,百万条向量每月大概二十美元。小项目用着不贵,但总归是一笔固定开销。2026 年就不一样了。开源的 Chroma、Milvus,本地部署完全免费,功能对中小项目来说绰绰有余。就算用云服务版,一个小实例每月也就几十块钱,和白送差不多。更省事的是,现在很多大模型 API 直接内置了记忆功能。比如豆包的 Agent 平台,后台开个开关就自动生效,不用自己搭向量库,也不用写代码维护。省了至少两三天的开发量。早些年搭向量库还挺折腾人的,我认识个新人光部署 Milvus 就踩了三天坑,端口死活连不上,最后抱着电脑在技术群里蹲到凌晨两点。现在倒好,新人上手连向量库是什么都不用深究,直接就能用。记忆这东西,其实和人的心性一样。装得多了,就容易杂,容易乱。从前要专门打个匣子分门别类放好,现在匣子直接做在了模子里,省了不少归置的功夫。光有记性还不够,Agent 能不能干活,干得好不好,全看工具接得顺不顺。就像一个佣人,光会听话不行,还得会扫地、会做饭、会出门买东西。工具就是 Agent 的手和脚,接得越多,能做的事就越多。常用的工具翻来覆去也就那几样:网页搜索、文件读写、代码执行、自定义 API 对接。先说网页搜索。2025 年的时候,要自己接 SerpAPI 或者谷歌搜索接口,调用一次几分钱,准确率还忽高忽低。现在不用了,主流模型的 API 基本都自带联网检索功能。开关一开就能用,检索结果的准确率,比 2025 年自己接第三方接口高两成左右。关键是不额外收钱,都包含在 token 费用里。然后是文件解析。PDF、Excel、Word、图片,这些格式的文件,从前要接专门的解析库。格式稍微乱一点,解析出来就全是乱码,还要自己写正则表达式一点点修。现在原生多模态模型普及了,直接把文件传进去就行。表格里的数字,图片里的文字,扫描件里的印章,都能认得明明白白。省了至少三成的开发工作量。代码执行和自定义工具,稍微麻烦一点。要按照 Function Call 的格式,写清楚函数名、参数、功能说明。熟手半天能写五六个工具,新手对着官方文档抄例子,两三天也能跑通。很多人一上来就说要用 LangChain 框架。搁两年前这话没错,那时候工具调用、记忆、流程都要自己拼,框架能省很多事。现在不一样了。不是说框架不好,是很多人根本用不上那么多功能。就像你只是下楼买个菜,没必要开个货车去。我见过不少项目,整个代码里 LangChain 占了一大半,真正的业务逻辑没几行,出了 bug 排查半天,最后发现是框架本身的兼容问题。简单的单 Agent,直接调用模型原生的工具调用接口就行。延迟比用框架低百分之四十,代码量少一半,出了问题也好排查。框架反倒适合复杂的多 Agent 协作场景,普通玩家根本用不上。就像做菜,家常小炒直接下锅炒就行,没必要摆一整套西餐餐具。排场是有了,菜反倒炒得不香了。很多人搭完工具,跑起来就傻了眼。Agent 做事东一榔头西一棒子,问它一个问题,它搜八九个不相干的网页,绕来绕去给不出个准话。这不是工具的问题,是缺了规划能力。就像一个没头苍蝇,翅膀再有力,也飞不到想去的地方。很多人搭完 Agent 第一反应是嫌它笨,其实不是笨,是没人教它按步骤做事。人刚上班还要带教呢,何况模型。最基础的规划,用 ReAct 模式就行。让模型一边思考一边行动,想清楚下一步做什么,再调用工具,拿到结果再接着想。这个不用额外开发,提示词里写清楚规则就行。比如 “先分析用户需求,再决定是否调用工具,拿到工具返回结果后,再给出最终回答”。效果不算顶尖,但日常用足够了。要求高一点的,用 Plan-and-Execute 模式。先列出来完整的执行计划,分好步骤,再一步步去做。中间遇到问题,还能自己调整计划。2025 年做这个,要自己写状态机维护整个流程,很是麻烦。现在很多模型都内置了规划模式,比如 DeepSeek 的 Agent 专用接口,传一段系统提示词就能开启。规划的准确率,比纯靠提示词写出来的高百分之三十五左右。再往上走,就是现在炒得很热的多 Agent。一个做调研,一个写文案,一个做审核,几个 Agent 分工协作。做这个一般用 CrewAI 或者 AutoGen 框架,搭起来不难,看着也热闹。2026 年上半年,GitHub 上新增的多 Agent 项目,比上一季度涨了一百二十 percent。我见过不少团队演示多 Agent,屏幕上几个头像跳来跳去,看着特别唬人。私下问落地情况,都打哈哈,说还在优化。【真正跑通商业闭环、能稳定盈利的多 Agent 项目,不到十分之一】。大多是搭起来演示的时候很惊艳,真要落地干实际的活,效率还不如一个熟手员工快。个中缘由,不必细说。数字摆在这里,懂的人自然懂。潮水漫过来之后
门槛一降,进来的人就多了。就像租界的公园收了门票钱,从前只有洋人能进,现在普通人花几个铜板也能逛了。最先涌进来的是个人开发者和小团队。2026 年第二季度,GitHub 上新增的 Agent 相关项目,比一季度涨了一倍还多。其中八成都是个人开发者做的垂直小工具。有做简历优化 Agent 的,有做客服回复 Agent 的,有做数据分析 Agent 的。大多是针对一个很小的场景,把流程跑通,挂在网上收点小钱。一个月赚个几千块,补贴点家用,倒是比上班自在。说起来也有意思,这波人里好多都是当年玩微信小程序、做 Chrome 插件的老面孔。风口换了一茬又一茬,做事的还是那批人。然后是传统的软件公司和 SaaS 厂商。从前做 CRM 的、做 ERP 的、做客服系统的,现在都忙着往自己的产品里加 Agent 模块。2026 年上半年,国内拿到融资的 Agent 应用公司有二十七家。其中一半以上,都是原来做企业服务的团队,换了个 Agent 的壳子,故事就又能讲一遍。当然了,换壳归换壳,真能把 Agent 嵌进业务里提效的,也不是没有。只是少,大多是凑个热闹,给 PPT 上加个新概念,方便出去谈客户。最热闹的当属知识付费圈。99 块钱的 Agent 搭建教程满天飞,号称三天学会,月入过万。课程内容翻开来,大多是把官方文档翻译一遍,配两个演示用的 Demo。我朋友圈里就有俩做课的,上个月刚卖完 AI 绘画课,这个月海报就换成了 Agent 实战营。文案都没怎么改,就把关键词换了换。买课的人不少,真能学完靠这个接单赚钱的,百无一二。就像当年上海滩流行开照相馆,懂不懂摄影的都租个门面架机器。真正能拍出好片子、留得住客人的,终究还是少数。也不能说人家割韭菜,毕竟信息差永远存在。有人愿意为捷径付钱,就有人愿意卖捷径。这也正常。任何风口起来的时候,都是卖铲子的先赚钱。等潮水退一点,才看得清谁在裸泳。很多人问,接下来 Agent 会往哪走。其实不用猜,看成本和技术的走势,就能摸个大概。先说价格。2026 年刚过去一半,已经降了三轮。按现在算力成本的下降速度,下半年大概率还有一到两轮调价。尤其是国产模型,输入价格很可能摸到每百万 token 一分钱的线。成本再降下去,Agent 就会从一个 “增值功能”,变成软件的标配。就像现在的网站都有搜索框,以后的软件都会带个 Agent 助手。再说技术方向。单 Agent 的能力现在已经很成熟了,日常的工作流基本都能覆盖。接下来的看点,一个是多 Agent 协作,一个是端侧 Agent。多 Agent 现在还在早期,坑很多,但潜力也大。真要是能把几个 Agent 的协作磨顺了,很多重复性的岗位工作,就能整个端掉。道理是这个道理,真落地又是另一回事,中间要踩的坑还多着呢。端侧 Agent 更是悄无声息地在推进。现在旗舰手机已经能流畅跑 7B 参数的模型了,延迟比云端调用低一半,数据还不用上传,隐私性好得多。2026 年下半年,预计会有三四家主流手机厂商,在系统里内置端侧 Agent 功能。到那时候,Agent 就不是电脑里的工具了,是揣在口袋里的随身助手。还有商业模式。现在做 Agent 定制开发,2025 年报价十几万起步,2026 年已经降到几万块。小团队接个小单子,几千块钱也做。再过个一年半载,搭个普通 Agent,可能就和现在做个小程序一样。成了外包行业里最普通的活计,赚个辛苦钱。技术从来都是这样。从神坛上走下来,落到尘土里,变成日常里随处可见的东西。才是它真正开始发挥作用的时候。说到底,AI Agent 从来不是什么遥不可及的黑科技。从前它摆在高级百货公司的橱窗里,打着聚光灯,标着天价。路人路过,顶多踮着脚看两眼,觉得是天上的东西,和自己没关系。现在价钱落下来了,伸手就能碰到,反倒有很多人站在原地不敢动。不知道该拿它做什么,也不知道自己能不能学会。其实哪有那么难。就像学骑自行车,看着难,真坐上去蹬两脚,晃悠几下,也就会了。难的从来不是技术本身,是站在边上想象出来的门槛。这城市的霓虹总在彻夜亮着,新的东西一波接一波涌过来。像黄浦江的潮水,涨得快,退得也快。有人赶着潮头赚快钱,有人蹲在岸边慢慢捡贝壳。没有谁高谁低,不过是各有各的活法。AI Agent 的潮水,现在刚漫过脚踝。再过些日子,说不定就没过了膝盖。再往后,人人都得在水里走。早一点摸清深浅,总比浪打过来了,才慌慌张张脱鞋子强。我会一直在这里,看着潮起潮落。把水底下的石子、泥沙、藏着的贝壳,都捡起来摊开给你看。不说漂亮话,不画大饼,只讲摸得着的实情,算得清的细账。要是觉得这些文字还有点用处,烦请点个在看,给公众号加个星标。这世上的公众号太多,人流太挤,一不小心走散了,再找回来就不容易了。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-06-28 17:39:42 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/812285.html
- 运行时间 : 0.098574s [ 吞吐率:10.14req/s ] 内存消耗:4,746.83kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=8f575b0994d232c0f45d091eda0d13c7
- CONNECT:[ UseTime:0.000518s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000655s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000312s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000240s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000474s ]
- SELECT * FROM `set` [ RunTime:0.000170s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000529s ]
- SELECT * FROM `article` WHERE `id` = 812285 LIMIT 1 [ RunTime:0.000930s ]
- UPDATE `article` SET `lasttime` = 1782639582 WHERE `id` = 812285 [ RunTime:0.009193s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000224s ]
- SELECT * FROM `article` WHERE `id` < 812285 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000386s ]
- SELECT * FROM `article` WHERE `id` > 812285 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.002204s ]
- SELECT * FROM `article` WHERE `id` < 812285 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.000613s ]
- SELECT * FROM `article` WHERE `id` < 812285 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.001823s ]
- SELECT * FROM `article` WHERE `id` < 812285 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.005795s ]
0.100066s