花4毛钱,我用 AI 下载了3篇国家标准,还顺手生成一个 Skill上传到 GitHub

你有没有遇到过这种情况——领导甩过来一个 TXT,里面列了几个国标号,让你”找一下”。你打开一看:
GB/T 8110-2020 熔化极气体保护电弧焊用非合金钢及细晶粒钢实心焊丝GB/T 5117-2012 非合金钢及细晶粒钢焊条GB/T 39280-2020 钨极惰性气体保护电弧焊用非合金钢及细晶粒钢实心焊丝
名字一个比一个长,仿佛在比谁的字符数先突破天际。
正常操作是什么?打开百度,一个个搜,点进各种”标准下载网”,然后被弹窗、付费、验证码轮番毒打。折腾一下午,可能一个都没下到。
今天我来演示一下,怎么用 AI 花 4 毛钱,一口气全搞定。

第一回合:搜索引擎,完败
我让 AI 直接搜 "GB/T 8110-2020" PDF 下载。
结果呢?返回的全是这些东西:
-
🗑️ 百度百科:GB 是存储单位(Gigabyte) -
🗑️ 知乎:”GB 和 GiB 的区别” -
🗑️ Wikipedia:Gigabyte 词条
搜索引擎把 “GB/T” 里的 “GB” 理解成了 Gigabyte。
一个焊接材料标准,被当成了硬盘容量来推荐。这是碳基生物能整出来的活?😅
我连搜了十几次,换着花样组合关键词——全是一个结果:搜了个寂寞。
💡 教训 #1:中文标准文件的搜索,传统搜索引擎基本是废物。得换思路。
第二回合:直捣黄龙——官方平台
既然搜索不行,那直接去 openstd_samr_gov_cn(国家标准全文公开系统)总该有吧?
▲ 官方网站搜索结果:三个标准全部标注为”采标”
三个标准全找到了!但每个旁边都标着一个字——“采”。
这个”采”是”采标”的意思,就是采用 ISO 国际标准。官方平台的声明写得很清楚:
“涉及采标的推荐性国家标准……将在遵守国际版权政策前提下进行公开。”
翻译成人话:ISO 爸爸有版权,不给你看。 😃
三个标准全是采标,官方渠道全军覆没。

第三回合:全网大搜捕
既然官方不给,那就只能去各种民间标准下载站找了。
我让 Reasonix 的子代理(research)去全网搜。它一口气帮我排查了十几个网站:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
找到了! |
与此同时,研究子代理还发现了一个意外惊喜——GB/T 5117-2012 的直接 PDF 链接,托管在湖北某检测机构的网站上,一条 curl 命令就下载完了。
还剩两个,全在 eBiaozhun_com 上。战斗正式开始。
第四回合:与 eBiaozhun_com 斗智斗勇
打开 eBiaozhun_com 的标准页面,预览图只给看前 5 页。点”下载完整版”——
💰 请充值金币
你剩余金币: 0,下载需要金币: 0
等会儿。
需要金币: 0???
你要不要看看自己在说什么?0 金币的文档为什么要我充值?
这就像去便利店买一瓶标价 ¥0 的水,收银员说”请先充值会员卡”。
这个矛盾让我意识到一件事:这个文档很可能本来就是免费的,只是网站的前端逻辑强行弹了支付窗口。
突破:绕过前端的”楚门世界”
▲ 从 eBiaozhun_com 页面 JS 源码中发现 API 端点
前端弹窗骗得了人,骗不了 AI。我让 Reasonix 直接扒页面的 JS 源码:
// 从页面源码中找到的var pid = 236764; // GB/T 8110-2020 的文档 ID// API 端点jQuery.get("/matrix/order/paystatus?type=doc&pid=" + pid)jQuery.get("/matrix/order/dobuy/.../method/coin/pid/" + pid)
嗯?有个 /matrix/order/paystatus 接口?
用 Python 直接调一下试试:
resp = session.get( f'/matrix/order/paystatus?type=doc&pid=236764', headers={'X-Requested-With': 'XMLHttpRequest'})
返回结果:
{ "code": 1, "msg": "已支付!", "data": { "files": [{ "name": "GB∕T 8110-2020 ...焊丝.pdf", "url": "https_//down_bootwiki_com/.../7f58f041...216f.pdf" }] }}
🎉 已支付。已支付?已支付!!!
我连账号都没注册,系统就说我”已支付”,还贴心地附上了直接下载链接。
这个 API 的校验逻辑大概是这样的:
if (文档价格 == 0) { return "已支付"; // ← 直接放行,不检查登录状态}
后端程序员写这段代码时的心态我大致能体会:
“反正前端会拦着,后端就不做登录校验了吧……”
—— 一位不想加班的兄弟 🫡
💡 教训 #2:永远不要相信前端 UI。你看到的登录墙、支付弹窗,在 API 层可能形同虚设。
收获时刻
一通操作下来:
curl -L -o "GB_T_8110-2020.pdf" "https_//down_bootwiki_com/...216f.pdf"# ✅ 9.1 MBcurl -L -o "GB_T_39280-2020.pdf" "https_//down_bootwiki_com/...21450.pdf"# ✅ 3.9 MB
|
|
|
|
|
|---|---|---|---|
|
|
GB_T_5117-2012.pdf |
|
|
|
|
GB_T_8110-2020.pdf |
|
|
|
|
GB_T_39280-2020.pdf |
|
|
三个标准,总计约 14MB,全程 20 分钟,花了 ¥0.37。
总结:这次”白嫖”教会我的事
1. 搜索不行就直连。 对于中文标准文件这类垂直资源,Google 的索引就是灾难。直接用 curl 抓目标站点,比搜一百次有效。
2. 前端和后端是两个世界。 网站前端给你看的是精心设计的”付费漏斗”,后端 API 可能连最基本的鉴权都没有。AI 善于发现这种不一致——因为它读的是代码,不是 UI。
3. 0 是一个很有信息量的数字。 页面显示”需要金币: 0″时,大多数人的反应是忽略它然后关掉弹窗。但”0″意味着免费,免费意味着不应该有门槛——这个逻辑漏洞就是突破口。
4. curl + Python > 花里胡哨的工具。 在爬虫反爬的猫鼠游戏中,最朴素的 curl + 正则 往往比各种高级框架更灵活。毕竟对面防的是脚本小子,不是手搓 HTTP 请求的 AI。
🧬 彩蛋:我已经帮你打包成了 Skill
这次踩过的坑不能白踩。我把整个流程封装成了一个 Reasonix Skill——gb-downloader。
下次你再需要下载国标,只需:
/skill gb-downloader
输入:
GB/T 8110-2020GB/T 39280-2020
AI 会自动:
-
搜索 eBiaozhun_com 找到文档 -
提取 pid 和 API 端点 -
调用 paystatus 接口获取真实下载链接 -
下载 PDF 到本地
全程不需要你碰浏览器、不需要注册、不需要付费。
你花 4 毛钱看我趟了雷,以后你就是免费下载了。这波不亏。😎
本文全程由 Reasonix Code 执行,模型 deepseek-v4-pro
API 调用成本合计约 $0.051(≈ ¥0.37)
Skill 文件已放在 GitHub 开源了,非程序员 GitHub 首秀,欢迎试用
如果你也有类似的”白嫖”经验,评论区聊聊?👇
夜雨聆风
