我又用AI做了一个专利工具—— 这次是「优先审查」一键判断

我又用AI做了一个专利工具

—— 这次是「优先审查」一键判断

一个不会写代码的专利代理师，用 AI 造的第二套生产力工具

原创 · 知识产权+AI·2026年5月

先说结论：上面这张图里所有功能，又都是我"聊"出来的

是的，你没看错。

输入技术方案 → AI 自动判断 IPC 分类号 → 四份国知局对照表毫秒级检索 → 一键判断能不能走优先审查。全程 30 秒。

而我，上一次用 AI 做了一套 2893 家代理机构检索系统之后，这次又用 AI 聊出了一套专利优先审查判断系统。不会写 Python 后端、不会写前端页面、没碰过 Nginx 配置。

如果我都能做到，你也一定能。

▲ 首次访问弹出公众号关注引导——跟上一套系统一样，引流不能少

···

第一章：上次那套系统，给了我底气

可能有些读者第一次看到我的文章。先花一分钟回顾一下——

我上一篇文章详细记录了，怎么用 AI（Claude Code）做出一套完整的「专利代理机构精准保障名单查询系统」。全程没有写一行代码，靠的就是用中文跟 AI 对话。

上一套系统长什么样

最终产出了一套完整的 Web 应用，部署在 AWS 云端，现在仍然在线使用：

• 2893 家代理机构数据，AI 写爬虫从国知局网站自动抓取（12 小时跑完）

• 6 个可视化图表的仪表盘，一屏全览全国机构分布

• 中国地图热力图——北京 650 家颜色最深，一眼看出地域集中度

• 多维度筛选 + 模糊搜索 + 排序 + 分页 + 详情弹窗

• 暗色模式一键切换、CSV 数据导出、公众号引流弹窗

• 部署到 AWS 云服务器，Nginx + PM2，域名访问

而操作过程，我做的事就是——说"这里改个颜色""加个排序功能""能不能导出 Excel"。AI 听懂了，改了，跑起来了。

有读者问："你是不是有技术背景？"

答：真没有。HTML 不会写、CSS 不认识、服务器没碰过。秘诀就一条——把 AI 当成不会累的技术合伙人，用中文把业务需求说清楚。

做完第一套系统之后，我信心大增。正好工作中频繁遇到另一个痛点——优先审查判断。于是我跟 AI 说：再做一个。

···

第二章：优先审查判断 —— 每个代理人都逃不掉的高频痛点

做专利代理的都清楚：优先审查能大幅缩短审查周期——发明专利从平均 2-3 年缩短到 3-6 个月。对客户来说，这可能是产品上市时间的关键差距。

但申请优先审查的第一关，就让很多人犯难——

你的 IPC 分类号，在不在国知局公布的对照表里？

国知局发布了四份专利分类对照表，用来界定哪些技术方向可以申请优先审查：

• 战略性新兴产业分类与国际专利分类参照关系表 —— 3000+ IPC

• 绿色技术专利分类体系 —— 780 IPC，含"全部涉及 / 部分涉及"区分

• 关键数字技术专利分类体系 —— 4200+ IPC，AI、芯片、量子计算、大数据等

• 「新三样」相关技术专利分类体系 —— 380 IPC，电动汽车、锂电池、光伏

四个 PDF，加起来几百页，总共超过 8400 个 IPC 分类号。

更麻烦的是，这些 PDF 里的匹配规则并不一样——

• 有些带 * 号 —— 表示该前缀及以下所有子类都算命中（通配符）

• 有些加了 NOT 排除 —— 比如 G06F11* 但不含 G06F11/14 和 G06F11/36

• 绿色技术体系里，同一个分类号可能标注"全部涉及"或"部分涉及"，处理逻辑完全不同

每次判断一个申请能不能走优先审查，就是在这四份 PDF 里面大海捞针。搞不好还要跟同事来回讨论半天。

我心想：这个流程，AI 绝对能帮上忙。

▲ 系统主界面全貌——三个Tab：智能判断、对照表浏览、对照表检索

···

第三章：从 PDF 到结构化数据 —— AI 啃下了最硬的骨头

做这套系统最难的部分，其实不是让 AI 判断分类号，而是第一步——

把四份 PDF 对照表变成计算机可以检索的结构化数据。

PDF 是给人看的，不是给机器看的。四份 PDF 的表格格式千奇百怪——

• 跨页行 —— 一行数据被分到两页上，解析程序需要自动判断下一页的文本是"延续上一行"还是"新的一行"

• 多级嵌套 —— 表4（新三样）有四级层级（一级目录 → 二级 → 三级 → 四级），每一级都有各自的关键词和 IPC 分类号

• 半口语化表述 —— 比如"主要涉及小类有："这种写法，需要专门写正则来抓取

• 限定词区分 —— 表2 里同一个 IPC 号可能是"全部涉及"或"部分涉及"，匹配规则完全不同

我把 PDF 丢给 AI，让它用 pymupdf（一个 Python PDF 解析库）逐页提取文本，然后写了一套状态机来跟踪当前所处的层级位置。

大概的思路是：读 PDF 每一行 → 判断这行是哪个层级（通过编号格式和缩进判断） → 如果检测到新的层级编号就切换上下文 → 如果上一行没有结束符就判定为跨页延续 → 提取 IPC 分类号和关键词 → 输出结构化 JSON。

思路不复杂，但 PDF 的坑特别多。AI 写了 200 多行解析脚本，我跟它反复调试了十来轮——每次它解析完一批数据，我抽查几条看看有没有乱入、遗漏，有问题就截图丢给它修。

最终解析成果

四份 PDF → 四个结构化 JSON 文件 → 总共超过 8400 条 IPC 分类号：

• 表1 战略性新兴产业：3000+ 条 IPC 分类号

• 表2 绿色技术：780 条分类号，含 NOT 排除和全部/部分涉及逻辑

• 表3 关键数字技术：4244 条分类号，含 * 通配符匹配

• 表4 新三样：380 条分类号，四级层级嵌套

四份对照表，全部装进了系统里。查询速度：毫秒级。

▲ 专利信息输入界面：填写技术方案描述后，AI 自动判断 IPC 分类号

···

第四章：匹配引擎 —— 然后 AI 自己发现了一个隐藏 Bug

有了数据，还需要一套匹配引擎。核心逻辑：输入一个 IPC 分类号 → 在四份对照表中查找 → 返回命中了哪个技术方向。

AI 设计了"最长前缀优先"匹配算法——

比如 G06F18/00 → 系统先匹配 G06F → 再匹配 G06F18 → 最具体的那个匹配就是答案。

同时处理通配符（G06F* = G06F 及所有下级子类全部命中）和 NOT 排除（G06F11* 但不含 G06F11/14 和 G06F11/36）。

匹配引擎写完，我开始测试。输入了几个我知道答案的分类号——

然后出事了

我输入 F23D14/26。这个分类号我确定属于绿色技术体系（表2），但系统告诉我"无匹配结果"。

我截图丢给 AI，让它排查。AI 翻了一遍代码之后，给出的诊断让我吃了一惊——

"问题不在匹配引擎，在 build 脚本。把表2原始数据转成 JSON 的时候，每个子类的 IPC 条目被 [:50] 截断了——只保留前 50 条就丢弃了后面的。"

"表2 的「1.1 煤炭清洁高效利用」子类实际有 133 条 IPC，但因为截断只保留了前 50 条。F23D14/26 刚好在第 50 条之后。"

"我检查了表3，情况更严重——被 [:100] 截断，丢失了 444 条数据。两个表合计，540 条分类号被截掉了。"

这个 Bug，我根本不会自己发现。我甚至不知道 build 脚本里有限制——那是我几次迭代之前，AI 为了"防数据太大"自己加的。

AI 不仅找到了代码里 540 条数据被截断的 Bug，还主动修好了。

这件事给我的触动很深。AI 不只是"听话写代码"，它在帮你排查问题的时候，能追溯到自己之前写的代码里找逻辑缺陷。这种能力，已经不是"工具"两个字能概括的了。

···

第五章：双层判断 —— AI 分析 + 本地匹配，交叉验证

IPC 匹配引擎负责"查表"，但还有一个问题——谁来给专利分 IPC？这需要 AI 来理解技术方案。

系统设计了两层判断逻辑：

第一层：AI 语义理解（DeepSeek API）

调用 DeepSeek API，用 Function Calling 模式让 AI 阅读用户输入的技术方案描述。AI 分析技术领域后：

• 输出最可能的 IPC 分类号

• 给出置信度（高 / 中 / 低）

• 附上分类说明——为什么判定这个分类号，技术依据是什么

注意：这一步不是简单查表，是让 AI 真正"读懂"技术方案。同样是"图像识别"，可能是 G06F18（计算机视觉），也可能是 G06V10（模式识别），还可能涉及 G06T7（图像分析）——AI 根据具体描述来选择。

第二层：本地精确匹配（对照表检索）

拿到 AI 输出的 IPC 之后，匹配引擎在四份对照表中做本地精确检索。返回结果包含——

• 这张表叫什么名字（战略新兴产业 / 绿色技术 / 关键数字技术 / 新三样）

• 属于哪个大类 → 哪个子类（完整层级路径）

• 匹配到的具体 IPC 条目是什么，匹配精度如何

两层交叉验证：AI 负责"理解技术方案"，本地引擎负责"精确查表"。两边的结果互相印证。

你可以自己核对每一个匹配结果。不是黑盒。

▲ 判断结果展示区：IPC 分类号 + 置信度 + 对照表命中位置 + AI 详细分析

···

第六章：四张对照表，一键浏览 + 全文搜索

除了 AI 判断功能，系统还做了两个可以直接用的工具：

对照表浏览 —— 想看哪张点哪张

四份对照表展开在页面上，按"大类 → 子类 → 单个 IPC 条目"的层级组织。想看绿色技术有哪些方向？点开、展开、翻——每条 IPC 都带着技术关键词说明，不用再去翻原始 PDF。

• 总共 4 张主表，几十个产业大类，上百个技术子类

• 每个子类下面列出完整的 IPC 分类号和对应的技术领域说明

• 点一下展开、再点一下折叠——跟文件夹一样操作

▲ 四份对照表浏览页——按产业大类分开展示，点击即可展开

▲ 展开到最细层级——每个子类下的 IPC 分类号 + 技术关键词说明，一目了然

对照表检索 —— 输入关键词或 IPC 号，秒出结果

支持两种检索方式：

• 按 IPC 分类号查：输入 G06F18，显示该分类号在四张表中分别命中哪些位置

• 按关键词查：输入"锂电池"，搜索所有涉及锂电池的技术分类条目

搜索范围覆盖四份对照表的全部内容——IPC 分类号 + 技术名称 + 关键词说明。

▲ 按 IPC 分类号 G06F18 检索——在战略新兴产业和关键数字技术两张表中命中

▲ 按关键词"锂电池"检索——跨表搜索结果，每个命中项显示所属表名和分类路径

···

第七章：优先审查被驳回？先用这个自查三点

做这套系统的过程中，我反复测试了大量分类号，对优先审查判断有了更具体的认识。总结下来，被驳回的原因就三类——

第一坑：分类号不在对照表里 —— 硬门槛

国知局四份对照表是白名单机制——不在表里的分类号，优先审查走不通。但八千多个分类号、"全部涉及/部分涉及"的区分、各种 NOT 排除——人眼一个一个核对太容易漏。

用工具的检索功能，输入你的 IPC 分类号，30 秒确认。

第二坑：技术方案描述太笼统 —— 审查员看不出产业关联

"一种新型节能装置""一种智能化控制系统"——这种写法，审查员根本看不出来跟重点产业的具体关系。优先审查的核心逻辑是：你的技术方案必须清晰地落入国家重点支持的技术方向。

描述越具体、跟对照表里的技术分支对应关系越明确，通过率越高。比如不要说"节能装置"，说"一种基于相变储热的工业余热回收系统"。

第三坑：四张表选错了 —— 匹配度天差地别

四份对照表有交叉但不完全重叠。举个例子——"智能电网"在绿色技术体系里有（节能储能方向），同时在关键数字技术里也有（大数据+能源管理方向）。选哪张表匹配度更高？选错了，可能直接导致判断结果变成"不符合"。

我们的系统同时在四张表中检索，给出每张表的命中情况——你不用猜。

···

第八章：部署上线 —— 两个项目，一台服务器

系统写完了，要上线。

上一套代理机构检索系统已经跑在一台 AWS EC2 t2.micro 服务器上（1核1G，954MB 内存）—— Express + PM2 + Nginx。

这台服务器本来就不宽裕。再加一套 Flask 应用，内存够吗？端口怎么分？

AI 给出的方案非常简单：

Nginx 路径路由 —— 同一个对外端口，承载两个项目。

两个项目、同一台服务器、同一个对外端口（3001）、各自独立运行、互不影响。一个 1 核 1G 的 t2.micro，稳稳地承载两套完整的 Web 应用。

部署过程，AI 一步步指导我：SSH 连上服务器 → 装好 Python 依赖 → 用 Waitress 替代 Gunicorn（内存更轻） → 写 server.py 启动脚本 → 配 Nginx 路径路由 → PM2 守护进程。全程我在终端里复制粘贴 AI 给的命令，没写过一行配置。

部署完成后，我在服务器上跑了一下——

两个项目内存合计约 135MB。机器还有 800MB 空闲。

···

这次做系统，我又加深了一个信念

上次那篇文章的结尾，我说过一句话。这次做完第二套工具，我的体会更深了：

AI 时代，知识产权行业的竞争壁垒，不再是"谁会写代码"——

而是"谁更懂业务、谁更有想法、谁愿意花一个下午把想法变成工具"。

第一套系统证明了"一个不会编程的人用 AI 能做出一套工具"。

第二套系统证明了"这个模式可以复制——越做越快"。

第一套花了一个周末，第二套一个下午就搞定了核心功能。因为很多技术积累已经在那儿了——Flask、Nginx、PM2、服务器架构、路径路由——AI 都有了上下文，说一句话就能复用。

两套系统回顾

全程我没有写一行代码：

• 2893 家代理机构检索系统 —— Node.js + ECharts + 数据仪表盘 + 中国地图 + 暗色模式

• 专利优先审查判断系统 —— Python Flask + DeepSeek AI + 8400+ IPC 匹配引擎 + 四份对照表

两套系统、同一台服务器、同一个端口、都在线上跑着。

而且我相信，第三套只会更快。

···

这次你最想要哪个功能？评论区告诉我

跟上次一样——点赞最多的需求，我下一个就用 AI 做出来，并且把完整的开发过程公开分享：

• A. 批量判断 —— 一次提交多个专利，批量输出优先审查结果

• B. 生成优先审查申请理由书 —— 结合匹配结果自动生成申请文书

• C. 对接专利年费监控 —— 优先审查 + 年费提醒，一站式管理

• D. 支持更多对照表 —— 自动追踪国知局更新，保持数据最新

• E. 其他 —— 评论区发挥，说不定你的想法就变成下一个工具

···

系统免费使用。需要自己注册一个 DeepSeek API Key（deepseek.com 免费注册即得，新用户有免费额度）。

体验地址：一定要关注我

长按识别二维码，关注本公众号

获取更多「知识产权× AI」实操案例与生产力工具分享

��评论区告诉我：你最想要的 AI+知识产权工具是什么？

点「在看」让更多同行看到，一起推动行业的 AI 化

❤ 点「在看」让更多同行看到|💬 评论区告诉我你的需求|🔄 转发给需要的同行

···

— END —