
上个月我干了一件事:
把我们团队每周要做一次的「竞品周报」,整个甩给 AI Agent 跑。
从抓数据、整理信息、写初稿,到发飞书、通知相关人,全流程自动化。
第一次跑完我以为自己要起飞了,结果 Agent 给老板发了一份中英混排、格式全乱的文档,还在结尾加了一句"以上内容仅供参考,请以实际情况为准"。
当时我就明白了:最难的不是让 Agent 干活,是让它干出不让人尴尬的活。
这篇文章把整个过程掰开了讲,踩的坑一个不漏。
01 · 我想让 Agent 做什么
我们是一个做 B 端 SaaS 的团队,产品线竞争激烈,PM 和我每周要花半天时间写一份竞品周报。
内容包括:
每次做完我都觉得这是重复劳动,但每次都舍不得跳过——因为这份报告确实有用。典型的"高价值低含金量人工"。
02 · 原来的人工流程是什么样
在让 Agent 接手之前,我先把人工流程完整画了一遍。这一步很关键,很多人跳过了,最后发现 Agent 做的根本不是自己想要的东西。
原始人工流程
每周耗时约 170 分钟 · 横跨两天 · 容易断流
问题在于这 170 分钟不是连续的,中间有大量等待和切换,实际上占了我将近半天。而且人工做的时候会偷懒,遇到英文页面就扫一眼,不一定能发现真正重要的更新。
03 · 我怎么拆任务给 Agent
这里有个我踩过的大坑,值得单独说:
千万不要把整个任务丢给一个 Agent。我第一次就这么干的:写了一个超长 Prompt,让它"帮我完成竞品周报从收集到发送的全流程"。结果它把所有步骤混在一起,一旦中间某一步出错,整个链路就断了,而且我完全不知道断在哪里。
正确的做法是拆成独立的小 Agent,每个只干一件事:
每个 Agent 之间的接口只有一种数据格式,出错了知道在哪断,修也好修。这个思路其实和写微服务一样,不是什么新概念,只是用在 Agent 设计上很多人还没想清楚。
04 · 用了哪些工具和模型
不吹不踩,这是我实际用的技术栈,每个都有选择理由:
一共花了我 2 个周末搭起来,其中 60% 的时间在调 Prompt 和处理边缘情况,不是在写业务逻辑。
05 · 第一次运行,哪里翻车了
翻车记录完整保留,这部分才是干货。
现象:摘要输出一半中文一半英文,标题层级不对,有的用 ## 有的用 **加粗**,飞书渲染出来一塌糊涂。
原因:Prompt 里没有给示例,只说了"按照固定格式输出",模型自己发明了格式。
现象:竞品上周更新的功能,这周又出现在报告里,说成是"最新动态"。
原因:没有历史去重机制,Agent 不知道什么是"上周已经报过的"。
现象:就是开头说的,结尾加了"仅供参考"。还有一次加了一段"由于网络限制,部分内容可能不完整",发到群里很尴尬。
原因:没有在 Prompt 里明确禁止模型加任何解释性文字。
现象:竞品官网做了改版,Firecrawl 抓回来的内容变成了导航菜单的重复,Agent 一直在重试,整个流程卡了 2 小时。
原因:没有单个节点的超时和熔断机制。
四个坑,没有一个是"模型不够聪明"导致的。都是工程问题。这是我做完这件事最大的感悟。
06 · 怎么加知识库、审核和兜底
针对上面四个翻车,我加了三层防护:
一个反直觉的发现:加了人工审核窗之后,我反而更愿意相信这套系统了。不是因为它更聪明,是因为我知道最坏情况下我还有机会兜底。这个心理安全感让系统真正被我长期用起来。
07 · 最后节省了多少时间
跑了 6 周,数据是真实的:
那 2 分钟是看审核预览并点确认发送
除了时间,还有两个没想到的收益:
覆盖面变宽了。人工做的时候我只看 5 个重点竞品,现在 Agent 顺手把 3 个次要竞品也一起扫了,额外多出来的,之前因为"懒得看"漏掉的信息,有两次发现了对产品决策很重要的内容。
报告质量更稳定。人工做的时候周五下班前状态不好的话,报告写得比较马虎。Agent 不会有情绪,每次质量基本一致。
08 · 给程序员的 3 个真实建议
做完这件事,如果让我给想入手 AI Agent 的人只说三条,是这三条:
很多人上来就问"用什么框架",但连自己想自动化的流程都没想明白。先把每一步是什么、输入输出是什么、出错了怎么处理,用文字或者流程图写清楚,Agent 的设计自然就出来了。这步不能省,省了后面全返工。
不是让你不信任 AI,是让你找到值得信任它的地方。收集、格式化、去重——完全可以信。内容是否该发、信息是否准确、措辞是否合适——先留一个人工确认窗口。等你跑了足够多次、有了足够信心,再慢慢把这个窗口拿掉。
帮自己解决问题,而不是帮别人解决假想的问题。原因很简单:你知道什么叫"结果好",你有动力去修问题,你也最清楚哪里容易翻车。这个竞品周报是我自己每周要做的事,所以我有极强的动力把它做对。如果只是拿来练手,做了两周就扔掉了,学不到真东西。
DeepSeek API调用实战:从环境搭建到生产级应用的完整指南 让大模型不再胡说八道的那套核心技术:RAG 完整拆解 我用AI Agent炒A股,亏了3000块后顿悟了 DeepSeek V4这场仗打到这个份上,我已经看到太多人判断错了 5分钟学会用AI写爆款文案:打工人的文案神器指南· · ·
最后说一句可能让你失望的话:
AI Agent 这件事,最难的从来不是技术是搞清楚「什么值得自动化」和「出错了谁来兜底」
代码是最容易的部分。我花在 Prompt 调优、边缘处理、审核设计上的时间,是写代码的 3 倍。
程序秘籍 | AI Agent实战 · 大模型工程化 · 程序员AI转型
觉得有用,点个❤支持,转发给有需要的同事

夜雨聆风