[AI Agent]WorkBuddy+阿里云百炼零成本构建古诗词AI解读系统的Skill分享

AI杂物社 · AI Agent技术分享系列
之前写过两篇关于 WorkBuddy 的文章已经发布:
1. 《使用 WorkBuddy一键发布公众号》 —— 讨论了如何通过微信公众号API,让AI自动完成素材上传、排版和写入草稿箱
2. 《使用WorkBuddy设计一键发布《AI解古诗》系列》 —— 详细记录了从零搭建古诗词AI解读系统的过程,包括文生图、OCR验证、智能闭环等模块
两篇文章的结论都很明确:能用,但不方便复用——你需要自己理解代码、自己搭环境。
那篇文章发布后,有朋友问同样的问题:「你这个东西看起来不错,但我要怎么用?」
问的人多了,我觉得应该换个思路:把整个项目经验打包成一个 Skill(技能),别人装上去就能用。
这就是本文要讲的——基于已完成的项目,提炼零成本要素,并用 WorkBuddy将之前的经验封装成可复用的 Skill,提供一种零成本并复用这个 Skill的完整方案。
文章结构:先看看最终效果 → 分析零成本要素 → 给出 Skill 复用方法 → 最后补充技术内幕。
[X]先看看这套组合能干什么
先说最终效果——输入一首古诗,AI 自动生成意境图,还能进行诗意解读、甚至生成短视频,这是我利用WorkBuddy+阿里云百炼将一个想法通过AI智能体实施并发布的案例的总结。基于此文+Skill,你可以尝试其他不同的想法并让它快速成型。
参考本文的方案+Skill后,你只需要按照在 WorkBuddy 里喊一句:
/zws-opt-bailian 用图片描述整首诗“《暮江吟》 一道残阳铺水中,半江瑟瑟半江红。可怜九月初三夜,露似真珠月似弓。”
Skill就会调阿里云百炼的模型,返回一段像这样的回复:

[X] 零成本要素分析:到底靠什么免费?
做这件事零成本的三个支柱:
支柱一:WorkBuddy(个人体验版)免费
相当于一个「会写代码的 AI 助手」,可以在 Windows/Mac 环境运行。它的核心能力是调用本地 Python 脚本,替你处理文件和网络请求,零费用。
这是底层基础设施——没有它,这个 Skill 就运行不起来,上个月发布的公众号文章大部分是通过WorkBuddy构建的,刚开始用的比较多,每天签到会赠送积分,目前已经赠送了10000多的积分,开发本项目花费了6000+积分,主要用于代码开发;还有4000+,还可以做一个其他项目的代码开发。

支柱二:阿里云百炼新用户三个月免费包
阿里云的大模型服务平台,提供通义千问(qwen)、DeepSeek、GLM、Kimi 等 260+ 种模型。新用户注册后送 90 天免费额度,视觉模型的大部分有50-500次的免费额度,大语言和全模态模型每个模型都有100万词元/Token免费额度,至少注册后的三个月可以随便用,支持API方式访问,免费的,支持设置“免费额度用完即停”,不用担心超额扣费。
下面截图中“视觉模型”使用数据是我为何选用“阿里云百炼”作为古诗词AI解读系统的API调用的原因:其中有目前国内模型中文生图效果不错的qwen-image-2.0-pro/qwen-image-2.0,而且有100次的免费使用次数。
> 这一步需要一个手机号和实名认证,正常注册流程。
申请后要记得批量选择“免费额度用完即停”

这两个工具加起来:¥0 启动成本。
支柱三:Skill 复用机制(本文重点)
前两篇发布文章的局限是:别人要复用你的系统,得读你的代码、理解你的逻辑、自己搭环境。Skill 机制改变了这一点——把整套方法论打包成一个「即插即用」的模块,别人只需要两步(安装 Skill + 配置 API Key)就能跑起来。
三个支柱缺一不可。前两个是外部资源,第三个是本文想传递的核心价值。
[OK] 从项目经验到可复用 Skill:它怎么来的
前两篇文章发布后,我发现虽然系统功能完整,但每次有朋友想用,我都得发一堆说明:先装Python → 再装依赖 → 然后复制脚本 → 再配置API Key → 还得讲解怎么调用……
这个过程重复几次后,我意识到:项目本身是可用的,但复用的门槛太高了。
WorkBuddy 的 Skill 机制正好解决这个问题。
熟悉OpenClaw的伙伴应该听到过Skill这个词,所谓 Skill,本质上是一个带描述文档的脚本目录。WorkBuddy 会自动扫描技能目录,加载每个 Skill 的 SKILL.md 定义,然后根据定义暴露的指令,把用户输入转发给对应的脚本执行。
那怎么把验证成功的经验总结成Skill呢,我的建议是:还是直接把问题交给WorkBuddy,看看它能不能做好?

经过几轮调试后,再利用Workbuddy进行来测试Skill的几个功能:


这样zws-opt-bailian的功能基本验证ok,就可以打包并分享了,其他人就可以直接使用了,这就是 Skill 的核心价值:降低复用门槛,让工具的使用者不需要关心工具的实现细节。
[OK] 两张入场券+本文Skill的分享链接:
① WorkBuddy(个人体验版)
下载地址:WorkBuddy 官方网站(https://www.codebuddy.cn/work/)。安装后注册即可使用。
注意:建议要求WorkBuddy使用Python代码进行开发,注册时赠送的积分+签到的积分主要用于代码和工具的开发,而AI相关的prompt优化,文生图,文生视频…这些消耗词元/Token比较多的操作就可以利用zws-opt-bailian Skill使用阿里云百炼中的各种大模型进行处理
② 阿里云百炼 API Key
注册并登录 https://bailian.console.aliyun.com/,在「API Key 管理」页面创建一个 Key,格式是 sk-xxxxxxxx。
③ zws-opt-bailian Skill
链接: https://pan.baidu.com/s/1FYD07grOqO2oC1TwZKHFtw?pwd=azws 提取码: azws
或关注本公众号后会收到自动回复,会包含各种最新的分享链接。
[Try] WorkBuddy中复用 zws-opt-bailian Skill 的方法
下载zws-opt-bailian.zip文件后参考安装视频进行操作:
两分钟验证,零成本启动。这就是 Skill 复用带来的体验。
[X] 技术内幕:Skill 包里有什么
你可能在想——这个 Skill 包里到底是什么?
zws-opt-bailian 技能包里包含四个 Python 脚本:
|
|
|
|
|---|---|---|
| bailian_chat.py |
|
|
| bailian_image.py |
|
|
| bailian_video.py |
|
|
| verify_config.py |
|
|
核心调用使用阿里云百炼的 OpenAI 兼容模式,往上走到达阿里云百炼,往下回传给 WorkBuddy——中间没有中间商、没有额外费用。
图像生成用的 DashScope 原生 SDK,视频生成是异步提交+轮询模式(因为视频生成需要 1-5 分钟)。
再说说 Skill 包的设计理念 —— 它不是一个死板的工具。SKILL.md 定义了一套流程:
– 首次使用:检测配置文件 → 不存在时自动弹出配置引导 → 帮你完成设置
– 后续使用:分析你的需求关键词 → 推荐最适合的模型 → 自动调用
– 不传 --model 时:自动使用默认模型,真正开箱即用
从命令行也能直接调用,不依赖 WorkBuddy 图形界面:
# 文本对话 python bailian_chat.py --prompt "解读这首诗的意境"
# 生成配图 python bailian_image.py -p "水墨风格山水画" -o output.png
# 生成视频 python bailian_video.py -p "柳树随风飘动" -o willow.mp4 --duration 5
这意味着你还可以把它集成到自己的脚本流程里,做批量处理。
[X] 避坑指南
1. 视频生成本身需要时间
不要急。视频 API 是异步的(必须加 X-DashScope-Async: enable 头),提交后需要轮询状态。通常 1-5 分钟,如果内容简单可能更快。
2. 默认模型的区别
– 日常对话/古诗解读:用 qwen3.6-plus(上下文长达 1M Token)
– 生成配图:用 qwen-image-2.0-pro
– 生成视频:用 wan2.7-t2v(支持自然语言分镜)
– 复杂推理(数学/逻辑):用 qwq-plus 或 deepseek-r1
新手阶段直接用默认模型就行,完全够用,若出现“返回403错误:AllocationQuota.FreeTierOnly.”的提示,则可以换一个其他模型继续使用,模型列表和用量使用情况查询https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-usage。
3. API Key 保密
配置文件里的 API Key 不要传到 GitHub 或任何公开地方。如果不小心泄露了,去阿里云百炼控制台删掉旧 Key 重新创建。
[OK] Skill 安装并应用指南(再次总结)
这里给一个速查清单:
– [ ] 已安装 WorkBuddy
– [ ] 已将zws-opt-bailian添加到技能
– [ ] 已注册阿里云百炼并获取 API Key
– [ ] 在WorkBuddy消息框中发出API Key
– [ ] WorkBuddy会自动安装必要的工具
– [ ] 输入验证指令并收到回复
全部打勾,说明你已经零成本复用了这套系统。
[总结] 这套方案到底值不值?
优势很明显:
1. 零成本:WorkBuddy 免费,百炼新用户三个月免费,前期投入为零
2. Skill 复用:从「读代码、搭环境」降级为「一步安装、两分钟验证」
3. 能进能退:三个月到期后,可以换成其他大模型 API(DeepSeek、通义千问等都有免费额度),也可以改成自己的付费 Key 继续用
4. 可扩展:从古诗解读扩展到作文辅导、数学解题或是其他想尝试AI智能体的场景——只需要换 prompt,流程不用变
PS:细心的小伙伴应该也看到了,WorkBuddy中可以选用最新的Deepseek-V4-Flash大模型了,初步试用下来看,这个模型表现挺不错,还特别省积分,很适合新手使用。另外最近在研究WorkBuddy的兄弟版本CodeBuddy,也选用了Deepseek-V4-Flash模型,这套组合在初始化项目阶段体验还行,界面和使用体验很像VS Code+Github Copilot,后续有进一步的心得再跟各位分享。
— 感谢阅读 · 关注「AI杂物社」—

夜雨聆风