AI Agent 的办公 Swiss Army Knife:商汤 SenseNova-Skills 开源全解析
一套让 AI Agent 真正干活的技能库,覆盖图像生成、PPT、数据分析、深度研究四大场景,兼容 OpenClaw 和 hermes-agent。

说实话,过去一年我们看了太多”AI 能聊天”的演示,但真正能在办公场景里跑完一整件事的——从读 Excel 到做 PPT,从搜资料到写报告——寥寥无几。
最近商汤旗下的 OpenSenseNova 在 GitHub 上开源了一套 SenseNova-Skills,直接把这事儿给补上了。它不是又一个模型,而是一整套面向 AI Agent 的办公技能库,让 Agent 从”会说话”变成”会干活”。
一、这到底是个啥?
简单讲,SenseNova-Skills 是一套遵循 Agent Skills[1] 规范的技能仓库。每个技能独立成一个目录,通过 SKILL.md 声明触发条件、能力边界和执行方式。
它直接对接 SenseNova 系列模型,兼容 OpenClaw 和 hermes-agent 这类 Agent 运行时。换句话说,你把仓库克隆到 skills 目录,Agent 重启后就能调用这些能力。
目前已经集成了 20+ 个技能,分成五大板块:
| 板块 | 核心能力 | 典型场景 |
|---|---|---|
| 🎨 图像与可视化 | 文生图、信息图、风格模仿、简历图片 | 自动生成汇报信息图、模仿品牌视觉风格 |
| 📊 PPT 生成 | 创意模式(全图)、标准模式(分页 HTML) | 行业分析报告、投研汇报、课堂演示 |
| 📈 数据分析 | Excel 多表分析、图像 OCR、大文件处理 | 价格趋势分析、财报数据清洗、图表复绘 |
| 🔬 深度研究 | 规划→取证→综合→成稿,支持断点续跑 | 竞品调研、行业研究、技术综述 |
| 🔍 搜索聚合 | 学术/代码/中英文社交平台 | 多源信息交叉验证、热点追踪 |
二、几个让人眼前一亮的技能
1. sn-infographic:信息图自动生成
这个技能算是仓库里的明星。它不只是把文字转图片,而是自动评估提示词、从 87 种布局和 66 种风格中选型,然后多轮生成 + VLM 评审 + 质量排序。
换句话说,你把一段复杂数据或报告丢给它,它能输出一张专业级、高密度、结构化的信息图。仓库里甚至有近 100 个生成案例的画廊可以参考,Prompt 怎么写也能”偷师”。
2. sn-ppt-standard:PPT 的标准工业流
做 PPT 最怕的就是”给了大纲但排版灾难”。这个技能走的是一个完整流水线:
风格定义 → 大纲生成 → 资产规划 → 分槽位图像生成 → VLM 质检
→ 分页 HTML → 分页评审(可选重写)→ 汇总 review → 导出 PPTX
每一页都有视觉审核,不满意还能回炉重造。对于经常做汇报的人来说,这基本就是把设计师和排版助理一起打包了。
3. sn-deep-research:深度研究的”流水线”
这个不是简单的”搜一搜、写一写”,而是有严格阶段的:
-
规划阶段:基于需求一次性产出 plan.json,定界、拆维度、定搜索策略 -
单维度取证:按 plan 调用搜索、筛选证据、交叉验证 -
综合判断:把多个子报告综合为 synthesis.md,明确主线、证据强弱、关键冲突 -
终稿写作:落成为 report.md,支持重写、润色、重组结构
最实用的是支持断点续跑——研究做到一半断了,重启后不用从头来。
三、端到端跑通:一个真实案例
仓库里有个叫 “内存价格分析” 的端到端示例,完整跑过了 数据分析 → 深度调研 → PPT 生成 三段闭环:
第一段:数据分析
-
读取原始报价 CSV,做字段刻画、品类标准化、时间戳对齐 -
从”整体走势””分品类涨幅 Top””服务器级 vs 消费级背离”三个角度刻画 -
定位到 2 月下旬的价格拐点
第二段:深度研究
-
把数据结论转化为研究问题 -
按维度规划检索:供给收缩、AI 服务器需求、原厂控产 -
多来源交叉验证后再写入报告
第三段:PPT 产出
-
16 页大纲 + 每页素材规划 -
分页 HTML 生成 + VLM 评审 -
分页截图合成最终 PPTX
最终叙事很清晰:价格在涨 → 为什么涨 → 怎么应对。这其实是很多行业研究的经典框架,但以前需要分析师 + 设计师 + 研究员三个人干一周的事,现在 Agent 一条流水线跑完。
四、怎么用上?
如果你已经在用 OpenClaw,安装简单到一句话:
git clone https://github.com/OpenSenseNova/SenseNova-Skills.git --depth=1
cp -r SenseNova-Skills/skills/* ~/.openclaw/skills/
然后重启 Agent 服务即可。Hermes 用户把目录换成 ~/.hermes/skills/。
当然,各分类技能有各自的 Python 依赖和 API key 配置,详细指引在 docs/ 目录下。不想自己搭环境的,可以直接用集成好的 小浣熊 Pro(xiaohuanxiong.com),SenseNova 6.7 Flash + Cowork-Skill 已经打包进去了。
五、一点个人看法
开源 Agent Skills 这件事本身比单个模型更有价值。模型决定的是”智商上限”,Skill 决定的是”能干多少活”。SenseNova-Skills 的价值在于把办公场景的完整工作流拆解成了可复用、可编排、可扩展的模块。
不过也要泼点冷水:这些技能对底层模型的多轮推理、工具调用、长上下文能力要求不低。如果接的是轻量级模型,体验可能打折扣。建议配合 SenseNova 平台 API 使用,目前有免费 token 套餐可以试。
总的来说,如果你正在玩 OpenClaw 或 hermes-agent,这个仓库值得 star 下来仔细研究。至少那个 sn-infographic 画廊,逛一圈就能学到不少 Prompt 设计思路。
项目地址:https://github.com/OpenSenseNova/SenseNova-Skills[2]
文档索引:
-
图像生成指南[3] -
PPT 生成指南[4] -
数据分析指南[5] -
深度研究指南[6]
引用链接
[1]Agent Skills: https://agentskills.io/
[2]https://github.com/OpenSenseNova/SenseNova-Skills
[3]图像生成指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/sn-image-generate.md
[4]PPT 生成指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/ppt-generate.md
[5]数据分析指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/data-analysis.md
[6]深度研究指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/deep-research.md
夜雨聆风