【AI辅助设计】我做了个设计 Skills,可以一键生成 UI 界面

前不久，我发了一个设计师推荐安装的 Skills 文章：【AI辅助设计】终于等到真正有用的 AI Skills：不是提示词合集，而是一套审美操作系统。在测试过程中，还不是那么得心应手，主要是最终产出上，还没贴近真实的工作流。于是就想着自己手搓一个 Skills，当然是站在众多开源 Skills 之上。

这两天我把这个想做很久的东西跑通了：

不是一个普通的 Prompt，也不是“帮我画个好看的界面”这种一次性提示词，而是一套能让 Agent 按设计流程工作的 「Agent Design Skills」。

它的目标很直接：给它一个品牌、一个方向、一个大致需求，它不仅能生成 UI，还要能把 UI 落到代码里，生成需要的视觉资产，补齐设计文档，再做浏览器 QA。

我这次我用我的 AI 小工具品牌 「MyGif」 （mygifai.com）做测试。需求一开始很简单：为 MyGif 设计并落地一个手机 App。

最后跑出来的结果，不只是一个页面。

它包括：

一个可运行的手机 App 原型
一套按 B 方案还原的视觉语言
生成并切好的 UI assets
设计 tokens
asset manifest
Figma-ready handoff
甚至还顺手做了一版融资用的网页 PPT

黑底、酸橙色、头像 rail、倾斜海报、Creator Feed，这些都来自同一个设计方向。

❝
由于跑一次的时间挺长，所以暂时就先跑一个页面进行验证😂。
❞

这个 Skills 想达成的目标

“一键生成 UI 界面”听起来很容易被误解。

如果只是生成一张好看的图，那现在已经不难了。

好看的图已经不稀缺了。

真正麻烦的是后面的事：

你生成了一张图，然后呢？

设计系统在哪里？按钮状态在哪里？移动端会不会溢出？图里的照片、贴纸、缩略图，哪些应该切成资产，哪些应该用代码重建？如果要交给前端，目录结构和组件拆分怎么处理？如果要给设计师，Figma 怎么交付？如果没有 Figma 工具，能不能至少给出可复建的 handoff？

这才是我做 Agent Design Skills 的原因。

我不想让 Agent 只停在“画一张概念图”。我希望它能像一个比较靠谱的设计生产助理：先理解需求，再探索方向，然后提取设计 DNA，生成资产，写代码，跑验证，最后留下可复用的设计资产。

换句话说，它要做的不是“画图”，而是把一个模糊的设计需求推进到一个可交付状态。

所以这里的“一键”，不是省掉设计判断。

它省掉的是大量机械的中间环节：「从设计方向到组件、从截图到资产、从视觉稿到可运行页面、从页面到 QA 记录。」

这次 MyGif 是怎么跑的

❝
这个 Skills 目前只适配了 codex。
❞

一开始，我让 Agent 为 MyGif 做一个手机 App。我录制了一个过程视频：

它先生成了三个方向：

A：偏干净、工具型的创作 App
B：黑底酸橙色，更像一个有社交感的创作者工作室
C：更偏实验性的编辑器和时间线

我选了 B。

「选择和判断很关键。」

因为 Design Skills 不应该在方向还没确定时就开始写代码。它需要先有一个视觉目标，再开始落地。

后面我发现第一版还不够。它只是“理解了 B 方案”，但没有真正还原 B 方案。

这也是一个很真实的问题。

很多 AI UI 生成都会犯这个错：它看懂了风格，但没有保住结构。最后出来的东西像是“受某个参考启发”，而不是“沿着这个方向设计出来”。

于是我要求它继续按 Design Skills 流程做三件事：

还原 B 方案的设计
对不能用代码写的 UI 元素，走“提取 UI 元素 -> 生图 -> 切图”的资产流程
补 Figma 交付

这一步之后，结果才真正进入可交付状态。

桌面预览里保留了手机壳和设计说明，方便对外展示。真正的 App 页面仍然是移动端优先。

关键在于：哪些东西用代码，哪些东西必须变成资产

做 UI 生成时，一个很重要的判断是：不能把所有东西都用 CSS 假装出来。

按钮、排版、卡片、底部导航、状态栏、交互状态，这些应该用代码写。

但照片、头像、海报、贴纸、内容缩略图，这些是语义媒体。它们如果只用色块替代，页面会立刻变成“假 UI”。

所以我在这个 Skills 里加了一条很硬的流程：

只要参考图里出现了需要被用户“看”的媒体内容，就要进入 「UI asset generation loop」。

这次 MyGif 里被提取出来的资产包括：

主视觉海报：MAKE IT POP
三张 Creator Feed 图片
五个 creator 头像

Agent 先生成这些图片，再把它们裁成 WebP，放进 public/assets/，然后写入 asset-manifest.json。

这张 contact sheet 是资产检查图。它说明页面里的图片不是 CSS 色块，而是真正生成、裁切、落盘的 UI assets。

这个 manifest 很重要。

它记录了每个元素的决策：

哪些是 code
哪些是 generate
哪些是 crop
哪些是 omit
每个资产的来源、用途、alt 文案和 QA 状态

这让 Agent 的设计过程有迹可循。

我不想要“凭感觉生成了一堆东西”。我希望每一步都能被追踪、复盘和修正。

Figma 这件事还没有完成

还有一个细节，我觉得值得单独说。因为我定义 Skills 时，是有说需要生成 Figma 文件的。

当时我问：没有生成 Figma 文件？

Agent 检查了一下当前环境，发现没有可直接创建 Figma 文件或 Figma 节点的 MCP 工具。

这时候有两种做法。

一种是糊弄一下，导出一张截图，说这是 Figma。

另一种是老老实实说：现在不能生成原生 .fig 文件，但可以产出 Figma-ready handoff。

我选第二种。

所以这个 Design Skills 里会明确区分三种东西：

原生可编辑 Figma
Figma-ready handoff
纯截图或 PDF

不能把截图叫成可编辑 Figma。

在没有 Figma 工具的情况下，它会输出：

frame spec
tokens
component inventory
asset manifest
layer JSON
handoff 文档

设计师拿到这些东西，可以比较快地在 Figma 里复建；开发也能知道代码和资产怎么对应。

这不是最完美的 Figma 自动化，但它比“拿一张图冒充设计文件”强得多。

❝
对，不够完美，后续我打算专门开发一个 Figma 插件，用于连接转换为 Figma 文件。
❞

这个插件，目前测试基本还原了设计稿，但是还是有些不足。

后面又顺手做了一版产品介绍 PPT

当 App 页面完成后，我继续让它做几页融资用的 PPT，要求用网页输出。这时候 Design Skills 继续沿用前面的品牌语言：黑底、酸橙色、强视觉冲击，但把布局尺度改成更适合投资人演示的 Web Deck。

最后生成了 10 页：

Cover
Problem
Solution
Product
Growth Loop
Business Model
Market
Moat
Roadmap
Ask

风格是对齐了主 App 的视觉设计，结果还不错。

这套 Skills 的建设思路

我现在对 Agent Skills 的理解越来越明确：

它不是一段万能 Prompt。

它更像一个小型工作流系统。

Prompt 解决的是“这一轮怎么说”。Skills 解决的是“这个人长期怎么工作”。

所以 Agent Design Skills 里，我主要做了几件事。

它的基础原理其实不复杂：

把设计工作拆成一条 Agent 必须走完的生产线。

「第一层是输入约束」。它不能只接收一句“做漂亮一点”，而是要尽量明确品牌、用户、页面类型、参考方向和交付物。

「第二层是设计决策」。Agent 要先探索方向，提取设计 DNA，把颜色、字体、圆角、布局、组件状态这些东西写成 tokens 和 frame spec。

「第三层是生产分工」。按钮、导航、卡片这些结构化 UI 用代码实现；头像、海报、缩略图、贴纸这些需要被用户检查的视觉内容，则进入“提取 UI 元素 -> 生图 -> 切图 -> 落盘”的资产循环。

「第四层是交付闭环」。页面写完之后不是结束，还要 build、截图、做视觉 QA，把发现的问题回到代码或资产层继续修。

这张图是 Agent Design Skills 的基础架构：输入约束、Skills Orchestrator、设计系统、资产与代码分工、交付 QA，以及最后留下来的可追踪产物。

所以它不是把 Prompt 写得更长。

它更像是给 Agent 装上一个设计团队的工作习惯：什么阶段该判断，什么阶段该生成，什么东西必须变成资产，什么东西必须进入 QA。

把设计流程写成硬门槛

新设计不能直接写代码。

要先有方向探索、设计 DNA、frame spec、资产清单，再进入实现。

这可以避免 Agent 一上来就写一堆看似完整但方向漂移的页面。

把资产判断变成显性流程

UI 里所有视觉元素都要分类。

能用代码写的，用代码。

需要用户检查的媒体内容，生成或切成资产。

不需要的装饰，记录为什么省略。

这个过程会写进 manifest，而不是藏在对话里。

把 QA 放进交付标准

我不希望 Agent 说“做好了”就结束。

它需要跑 build，需要做设计审计，需要截图看桌面和移动端，还要检查有没有水平溢出、有没有遮挡、交互状态是否可用。

这次 MyGif 就经历了几次修正：

第一版太像灵感稿，不够还原 B
状态栏符号太硬，后来改成 5G 86%
hash 路由不会自动切换，后来监听 hashchange
deck 页面需要重启 Vite 才正确加载，最后重新验证

这些都很小，但都是真实交付里会遇到的问题。

把设计资产保留下来

最终项目里会留下：

design/DESIGN.md
design/tokens.json
design/frame-spec.md
public/assets/asset-manifest.json
design/component-inventory.json
design/traceability.json
QA 截图

这让设计不是一次性输出，而是可以继续迭代。

怎么使用这个 Design Skills

实际使用非常简单。

你可以直接给 Agent 一个需求：

为 MyGif 品牌，设计、落地一个手机 app。[$agent-design](路径/agent-design/SKILL.md)

如果你已经有参考图，可以继续补一句：

我觉得 B 方案合适。请继续还原 B 方案，并按 asset pipeline 生成 UI assets。

如果你想要网页、App、融资 Deck，也可以直接说输出目标：

继续使用设计 Skills，帮我做几页产品介绍 PPT，使用网页输出即可。

比较推荐的用法是：不要只说“做漂亮一点”。

更好的方式是给它四类信息：

品牌或产品名
目标用户
输出物类型
是否有参考方向

比如：

为一个面向年轻创作者的 GIF App 做移动端首页。品牌名 MyGif。参考方向是黑底、酸橙色、社交创作工作室。需要可运行网页原型，并保留设计文档和 assets。

这样 Agent 更容易进入正确的生产流程。

它现在还不是终点

这套 Design Skills 现在已经能跑通很多事，但我不会说它已经完美。

接下来我还想继续测几类场景：

SaaS 官网
数据看板
电商活动页
小程序页面
品牌 landing page
Figma 工具接入
更严格的移动端视觉 QA
更稳定的 asset slicing

等我把测试和文档再补一轮，会考虑开源。

我希望它不是一个“炫技用的 Prompt 包”，而是一个能被别人装进工作流里的设计 Skills。

如果你也在做 Agent、设计自动化、AI UI 生成，应该能感受到这个方向的价值。

真正重要的不是让 AI 画出一张好看的图。

真正重要的是：让 AI 按专业工作流交付。

这件事我会继续加快速度。

如果你觉得这个方向有意思，记得点赞、收藏、关注，也欢迎推荐给身边做产品、设计、前端和 Agent 的朋友。

后面开源的时候，我会第一时间发出来。

「更多 AI 前沿技术与设计灵感，欢迎推荐一下「设计小站」公众号（ID：sjxz 00），一起探索科技与设计的融合创新。」