今天做了一场AI Agent应用的小范围内部分享,2小时,7个人围坐讨论。
结束后我整理了下,把最干的实操部分分享出来。
覆盖三块内容:
- Agent工具怎么选(个人助理+干活工具各推荐一个)
- 大模型怎么换(4个核心配置要素)
- 免费/付费API中转站(薅羊毛+商业化都给你方案)
文末还有3个真实商用案例,看完你就知道AI落地到底长什么样。
一、先搞懂一个核心概念:Harness
讲工具之前,必须先说一个词:Harness(控制工程)。
很多人用大模型,写了一段提示词,期待它按要求输出。结果输出乱七八糟,就说大模型不行。
这不是大模型的问题,是你没给大模型"上套"。
大模型就像一台动力很强的发动机。你不装方向盘、不装刹车、不装变速箱,发动机轰隆隆转,车跑哪儿去你根本管不住。
Harness就是给发动机套上整车架构。
本质是:通过提示词、工作流、代码多层约束,把大模型输出控制在预设要求内。
注意——不是简单的提示词工程,是一套工程化方法。
约束分强弱:
- 弱约束:纯提示词 → 大模型会"摸鱼",找最短路径交差,跳过你规定的流程还不告诉你
- 强约束:代码脚本 → 关键节点执行固定代码,输出稳定可控
商用场景,必须用强约束。
我之前给医院做出专业报告的模板,要求格式严格、输出严谨。纯提示词根本压不住,最后招了有代码基础的人,熬了几个通宵用代码做约束才稳定下来。
强约束的实现步骤:
1. 规范流程步骤,严禁跳过
2. 链路绑定:下一步输入=上一步输出
3. 要求输出后自检
4. 结果对比打分
5. 关键节点执行固定代码脚本(这是最强约束)

二、个人助理类Agent:推荐阿里QwenPaw
我把Agent分两类:个人助理型和工具干活型。
个人助理推荐:阿里QwenPaw。
我测了十几款同类工具,最后留下来长期用的就是QwenPaw。
核心优势:
- 开源免费
- Windows/Mac客户端都有
- 可部署到云端,手机远程访问
- 自带免费大模型,开箱即用
- 支持自定义更换模型
多Agent协同是杀手锏。
我现在不是用单一Agent,是用Agent团队。
部署成本:
- 腾讯云99元/年:四核4G,40G硬盘
- 数据盘加10G:约10元/月
- 整体年成本不到200元

我自己建了好几个专属Agent:
- 项目经理Agent
- 公众号运维Agent
- 会议秘书Agent
- 日程秘书Agent
- 财务秘书Agent
对接飞书群,自动整理会议纪要、调取资料,Agent团队的工作模式。
三、干活类Agent:推荐字节Trae Solo
干活用Agent推荐:字节的Trae Solo。
号称中国版Codex,核心优势:云端+本机+手机三端互联。
不同端的分工很清晰:
| 端 | 用途 |
|---|---|
| 云端 | 7×24小时在线当个人助理,不能换模型 |
| 本机端 | 可换模型、能操作浏览器、处理本地大文件,做具体工作 |
| 手机端 | 下发指令,连接云端+本机 |
几个让我点赞的点:
1)plan模式:执行任务前先输出计划+确认项,跟你对齐需求再执行,不会自作主张。
2)本机权限:对比豆包,Trae Solo能直接操作你的电脑。
我之前电脑输入法老自动切英文,让Trae Solo分析,它直接操作修复了。AI不再只是聊天工具,是真正的电脑助手。
3)国内友好:对比海外Codex,Trae Solo不用翻墙、不用海外手机号注册,直接手机号搞定。
小白用户友好:内置免费大模型+充裕免费额度,不需要自己买服务器。

四、大模型更换配置:4个核心要素
这是Agent的基础操作,但很多人卡在这里。
换大模型需要4个信息:
| 要素 | 说明 |
|---|---|
| API协议 | 主流两种:OpenAI格式 / Anthropic格式,不同协议Base URL格式不同 |
| Base URL | 大模型连接地址 |
| Model ID | 模型专属编号,有官方固定格式,不能乱填,必须复制官方信息 |
| API Key | 授权密钥 |
血泪教训:
不要让一个Agent自我配置。配置出错后Agent直接无法使用。
正确做法:用一个Agent给另一个Agent配置。
配置完成后一般有"测试"功能,先测一下连通性再保存。

五、免费API中转站:薅羊毛必备
1)Open Router(首选)
全球最大的第三方大模型中转站,几乎支持所有全球大模型。
最大价值:Free专区。
很多大厂会把未发布的测试模型放到Free专区供用户盲测:
- 英伟达测试模型
- GLM测试模型
- Kimi测试模型
- 谷歌测试模型
可以过滤仅显示免费模型,直接调用。
现场测试:关掉🪜依然能正常访问。
2)Open Code
本身是编程工具,附带免费大模型调用渠道。使用频次相对较低。
3)AI Lab的多模态API
目前免费开放多模态API,支持生成图像+视频。
六、付费API中转站:商业化用
1)API Mart(图像视频推荐)
最大特色:图像和视频模型齐全。
GPT-Image-2:
- 文生图
- 图生图
- 改图全功能
- 单次调用仅4分钱人民币
- 100张出图仅4块钱
出图中文错别字少,质量当前天花板。
2)字节Agent Plan套餐(高频使用推荐)
200元/月套餐:
- 10万积分
- 整合大语言模型+图像模型+视频模型+向量模型4类
- 普通使用基本够用
- 出视频单次消耗约1000多积分
两种模式怎么选:
- 日常固定使用 → 选包年套餐
- 偶尔需要多种模型 → 选中转站

七、3个真实商用案例
案例1:企业出图智能体
场景:给企业做定制化出图智能体。
功能:
- 模板上传
- 比例设置
- 参考图导入
- 企业VI规范
效果:
- 618活动海报生成:数分钟搞定
- 单次出图成本:4分钱
- 替代专职设计师部分工作
案例2:公众号自动生成智能体
场景:公众号日更压力大。
功能:
- 输入选题
- 自动撰写
- 自动排版
- 自动配图
- 推送草稿箱
效果:
- 全流程不超过10分钟
- 原本熟手半小时一篇
- 支持企业号日更
案例3:医疗减重评估系统
场景:医院减重管理项目。
痛点:
- 用户体检报告几十上百页
- 人工整理效率低
- 报告格式不统一
- 医生没法快速判断用户适合哪种减重方案
方案:
- 用户上传体检报告
- OCR识别(百度专用大模型,成本极低)
- 自动解析数据
- 生成几十页标准化评估报告
- 包含体态评估、运动安全评估、行为心理解读
- 排序列出适合的减重方案
关键点:这个项目必须用代码做强约束,因为医疗是低容错行业。
OCR用百度专用模型,成本较低。

八、两个行业判断
1)AI产业进度:还在刚开始的10%进度条。
很多人觉得AI已经成熟了,其实还早。现在只是工具门槛降低了,距离真正落地还有90%的路要走。
2)Token路线可能有天花板。
最近看到一个学术观点:两位诺奖得主提出,当前大模型依赖Token的发展路径存在天花板。
算力成本持续升高,不符合商业逻辑。
未来可能出现不需要Token的新发展路径。
九、一个真实变化:管理Agent
用AI之后我最大的感受:
原来只需要管人,现在人和Agent要一起管。
大概要花一半时间管理Agent:
- 模型切换
- Skill管理
- 结果校验
- 任务分配
我的日常:
- 微信和人聊天
- 飞书和机器人聊天
这个分工模式已经成了新常态。

写在最后
AI工具门槛降低后,稀缺的不是会用工具。
稀缺的是找到能落地的商业场景,把AI和具体业务结合创造真实价值。
工具天天在变,Agent月月在更新。
但会用工具 ≠ 能用AI赚钱。
能把AI嵌进业务流程,能用AI解决行业真问题的人,才是下一波红利收割者。
说明:本文整理自6月6日AI Agent主题分享实录(2小时),涉及的工具链接、Skill包会同步分享到内部交流群。
夜雨聆风