乐于分享
好东西不私藏

AI Agent 的办公 Swiss Army Knife:商汤 SenseNova-Skills 开源全解析

AI Agent 的办公 Swiss Army Knife:商汤 SenseNova-Skills 开源全解析

一套让 AI Agent 真正干活的技能库,覆盖图像生成、PPT、数据分析、深度研究四大场景,兼容 OpenClaw 和 hermes-agent。

说实话,过去一年我们看了太多”AI 能聊天”的演示,但真正能在办公场景里跑完一整件事的——从读 Excel 到做 PPT,从搜资料到写报告——寥寥无几。

最近商汤旗下的 OpenSenseNova 在 GitHub 上开源了一套 SenseNova-Skills,直接把这事儿给补上了。它不是又一个模型,而是一整套面向 AI Agent 的办公技能库,让 Agent 从”会说话”变成”会干活”。


一、这到底是个啥?

简单讲,SenseNova-Skills 是一套遵循 Agent Skills[1] 规范的技能仓库。每个技能独立成一个目录,通过 SKILL.md 声明触发条件、能力边界和执行方式。

它直接对接 SenseNova 系列模型,兼容 OpenClawhermes-agent 这类 Agent 运行时。换句话说,你把仓库克隆到 skills 目录,Agent 重启后就能调用这些能力。

目前已经集成了 20+ 个技能,分成五大板块:

板块 核心能力 典型场景
🎨 图像与可视化 文生图、信息图、风格模仿、简历图片 自动生成汇报信息图、模仿品牌视觉风格
📊 PPT 生成 创意模式(全图)、标准模式(分页 HTML) 行业分析报告、投研汇报、课堂演示
📈 数据分析 Excel 多表分析、图像 OCR、大文件处理 价格趋势分析、财报数据清洗、图表复绘
🔬 深度研究 规划→取证→综合→成稿,支持断点续跑 竞品调研、行业研究、技术综述
🔍 搜索聚合 学术/代码/中英文社交平台 多源信息交叉验证、热点追踪

二、几个让人眼前一亮的技能

1. sn-infographic:信息图自动生成

这个技能算是仓库里的明星。它不只是把文字转图片,而是自动评估提示词、从 87 种布局和 66 种风格中选型,然后多轮生成 + VLM 评审 + 质量排序。

换句话说,你把一段复杂数据或报告丢给它,它能输出一张专业级、高密度、结构化的信息图。仓库里甚至有近 100 个生成案例的画廊可以参考,Prompt 怎么写也能”偷师”。

2. sn-ppt-standard:PPT 的标准工业流

做 PPT 最怕的就是”给了大纲但排版灾难”。这个技能走的是一个完整流水线:

风格定义 → 大纲生成 → 资产规划 → 分槽位图像生成 → VLM 质检 
→ 分页 HTML → 分页评审(可选重写)→ 汇总 review → 导出 PPTX

每一页都有视觉审核,不满意还能回炉重造。对于经常做汇报的人来说,这基本就是把设计师和排版助理一起打包了。

3. sn-deep-research:深度研究的”流水线”

这个不是简单的”搜一搜、写一写”,而是有严格阶段的:

  1. 规划阶段:基于需求一次性产出 plan.json,定界、拆维度、定搜索策略
  2. 单维度取证:按 plan 调用搜索、筛选证据、交叉验证
  3. 综合判断:把多个子报告综合为 synthesis.md,明确主线、证据强弱、关键冲突
  4. 终稿写作:落成为 report.md,支持重写、润色、重组结构

最实用的是支持断点续跑——研究做到一半断了,重启后不用从头来。


三、端到端跑通:一个真实案例

仓库里有个叫 “内存价格分析” 的端到端示例,完整跑过了 数据分析 → 深度调研 → PPT 生成 三段闭环:

第一段:数据分析

  • 读取原始报价 CSV,做字段刻画、品类标准化、时间戳对齐
  • 从”整体走势””分品类涨幅 Top””服务器级 vs 消费级背离”三个角度刻画
  • 定位到 2 月下旬的价格拐点

第二段:深度研究

  • 把数据结论转化为研究问题
  • 按维度规划检索:供给收缩、AI 服务器需求、原厂控产
  • 多来源交叉验证后再写入报告

第三段:PPT 产出

  • 16 页大纲 + 每页素材规划
  • 分页 HTML 生成 + VLM 评审
  • 分页截图合成最终 PPTX

最终叙事很清晰:价格在涨 → 为什么涨 → 怎么应对。这其实是很多行业研究的经典框架,但以前需要分析师 + 设计师 + 研究员三个人干一周的事,现在 Agent 一条流水线跑完。


四、怎么用上?

如果你已经在用 OpenClaw,安装简单到一句话:

git clone https://github.com/OpenSenseNova/SenseNova-Skills.git --depth=1
cp -r SenseNova-Skills/skills/* ~/.openclaw/skills/

然后重启 Agent 服务即可。Hermes 用户把目录换成 ~/.hermes/skills/

当然,各分类技能有各自的 Python 依赖和 API key 配置,详细指引在 docs/ 目录下。不想自己搭环境的,可以直接用集成好的 小浣熊 Pro(xiaohuanxiong.com),SenseNova 6.7 Flash + Cowork-Skill 已经打包进去了。


五、一点个人看法

开源 Agent Skills 这件事本身比单个模型更有价值。模型决定的是”智商上限”,Skill 决定的是”能干多少活”。SenseNova-Skills 的价值在于把办公场景的完整工作流拆解成了可复用、可编排、可扩展的模块

不过也要泼点冷水:这些技能对底层模型的多轮推理、工具调用、长上下文能力要求不低。如果接的是轻量级模型,体验可能打折扣。建议配合 SenseNova 平台 API 使用,目前有免费 token 套餐可以试。

总的来说,如果你正在玩 OpenClaw 或 hermes-agent,这个仓库值得 star 下来仔细研究。至少那个 sn-infographic 画廊,逛一圈就能学到不少 Prompt 设计思路。


项目地址:https://github.com/OpenSenseNova/SenseNova-Skills[2]

文档索引

  • 图像生成指南[3]
  • PPT 生成指南[4]
  • 数据分析指南[5]
  • 深度研究指南[6]

引用链接

[1]Agent Skills: https://agentskills.io/

[2]https://github.com/OpenSenseNova/SenseNova-Skills

[3]图像生成指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/sn-image-generate.md

[4]PPT 生成指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/ppt-generate.md

[5]数据分析指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/data-analysis.md

[6]深度研究指南: https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/docs/deep-research.md