还在到处找模板?SenseNova-Skills信息图生成能力测评

每次做汇报、复盘或者做行业分析，你是不是还在各大设计网站上疯狂搜模板？甚至还要自费充会员？好不容易找到个差不多的，改文字、对齐字体、微调图标……折腾两小时，出来的效果还是透着一股“拼凑感”。

真的别再浪费生命了！

今天我们来实测一款“作图神器”——SenseNova-Skills。听说它只要一句话或者一份原始数据，就能自动帮你排版、配图，一键输出高逼格的信息图。不用懂设计，更不用四处找模板。这到底是用完直呼真香的“神仙工具”，还是只懂纸上谈兵的“噱头”？

Skill安装及配置

这次的测试Agent为opencode。一般来说，可以在Agent工具中用一句话让AI来帮你安装技能。

"Please install SenseNova-Skills from https://github.com/OpenSenseNova/SenseNova-Skills into your skills directory."

也可以选择手动安装。选择手动安装有以下好处：一、SenseNova-Skills全套有20几项技能，全部都安装了会导致上下文空间占用较多，AI在工具调用时也容易出现“选择困难症”；二、可以安装在非c盘的项目目录中，避免占用c盘空间。

把项目代码 https://cdn.gh-proxy.org/https://github.com/OpenSenseNova/SenseNova-Skills/archive/refs/heads/main.zip 整个zip包下载下来。zip包解压缩后，把skills目录放到项目目录的 .claude 子目录下。跟信息图相关的skill就只有 sn-image-base、sn-infographic 两个，再加上一个 sn-image-doctor 用于检测环境是否就绪。其他不相关的技能可以删掉。

启动opencode，用 /skills 命令，检查是否已经识别到技能

先检查一下环境，在opencode里面输入提示词：执行sn-image-doctor技能

检查环境主要就三个检测点：一、是否安装好 sn-image-base 技能；二、是否已经安装好技能底下python代码的依赖项；三、是否配置了大模型的API Key。

如果Python依赖没弄好，可以告诉AI让它来帮你安装。至于大模型API Key，与技能最配套的当然是商汤的API Key，一个Key就搞定了文本大模型、视觉大模型以及文生图大模型。

在项目目录下建一个 .env 的文件，填入以下内容

SN_BASE_URL="https://token.sensenova.cn/v1"SN_API_KEY="your-api-key"

在项目目录下再次启动opencode，opencode就会自动读取 .env 配置的环境变量。再次执行sn-image-doctor技能，确认环境已就绪。

信息图生成测试

输入提示词：生成信息图介绍“如何制作扬州炒饭”

然后Agent就会自动加载 sn-infographic 技能，按照技能要求作图。整个作图过程花费了大约10分钟

这是最后产生的成品

整个构图还是不错的，该有的要点也都写上去了。不过仔细地去看，还是可以发现有些汉字渲染得不对，例如step 2: 焯水切丁。文字渲染应该是 sensenova-u1-fast 模型的问题了。

在存放图片的目录下，还可以看到不少的中间生成文件。其中的 expanded-prompt.txt 就是最后文生图的提示词了。

既然有生成图片的提示词，交给更强大的文生图模型，看看画出来的效果怎样。sn-image-base 技能除了支持商汤自家的模型，也支持nano banana以及gpt-image，不过要花钱买api了。不花钱可以到网页去生成。

这是nano banana 2生成的

这是 MAI-Image-2.5生成的

这是 gpt-image2 生成的。

对比之下，gpt-image2 图片的精美度是遥遥领先的。

怎么做扬州炒饭，这是大模型内在的知识就知道的。再试个例子，大模型不知道的新知识。提示词：用一张信息图，解释小米MiMo-V2.5-Pro的UltraSpeed模式是怎么实现这么快的生成速度的。

opencode执行时，也知道先用Web Search功能了解相关技术背景，看懂了之后再开始作图

这是最后的成品

这次对比一下，在chatgpt里面同样用“用一张信息图，解释小米MiMo-V2.5-Pro的UltraSpeed模式是怎么实现这么快的生成速度的”，画出来的图片。chatgpt收到指令后第一轮并没有作图，而是先通过文本回答了快的原因，并询问需要的作图风格。在确定了作图风格后，第二轮才把图片画出来。

毫无疑问，gpt-image 2的图片更加美观，解析也更详尽。但是gpt-image 2回答的点似乎有点偏了，FP4量化和DFlash两个关键的技术都没有提到。而商汤的图，还是文字渲染有点小瑕疵。

再一个测试例子：设计一款2026年暑假西安手绘旅游攻略图，要有攻略、有景点、有交通信息、有美食推荐，横版，适合大屏阅读，风格及视觉元素匹配西安的历史感。宽高比21:9。

不过这次执行，中间出了岔子。因为中文编码的问题，中间文件变成了乱码，最后画出来的图也出问题了。又让AI重新搞了一次才正确生成。不过sensenova-u1只支持16:9的画面，最终画出来的是16:9的

还是文字渲染问题，核心景点和旅游顺序写了两遍，而且两遍的内容互相矛盾。

这套skill，设计能力是可以的，就是生图模型拖了后腿，得配合更强大的闭源商业模型才能发挥出实力。