乐于分享
好东西不私藏

花4毛钱,我用 AI 下载了3篇国家标准,还顺手生成一个 Skill上传到 GitHub

花4毛钱,我用 AI 下载了3篇国家标准,还顺手生成一个 Skill上传到 GitHub

你有没有遇到过这种情况——领导甩过来一个 TXT,里面列了几个国标号,让你”找一下”。你打开一看:

GB/T 8110-2020  熔化极气体保护电弧焊用非合金钢及细晶粒钢实心焊丝GB/T 5117-2012  非合金钢及细晶粒钢焊条GB/T 39280-2020  钨极惰性气体保护电弧焊用非合金钢及细晶粒钢实心焊丝

名字一个比一个长,仿佛在比谁的字符数先突破天际。

正常操作是什么?打开百度,一个个搜,点进各种”标准下载网”,然后被弹窗、付费、验证码轮番毒打。折腾一下午,可能一个都没下到。

今天我来演示一下,怎么用 AI 花 4 毛钱,一口气全搞定。

第一回合:搜索引擎,完败

我让 AI 直接搜 "GB/T 8110-2020" PDF 下载

结果呢?返回的全是这些东西:

  • 🗑️ 百度百科:GB 是存储单位(Gigabyte)
  • 🗑️ 知乎:”GB 和 GiB 的区别”
  • 🗑️ Wikipedia:Gigabyte 词条

搜索引擎把 “GB/T” 里的 “GB” 理解成了 Gigabyte

一个焊接材料标准,被当成了硬盘容量来推荐。这是碳基生物能整出来的活?😅

我连搜了十几次,换着花样组合关键词——全是一个结果:搜了个寂寞

💡 教训 #1中文标准文件的搜索,传统搜索引擎基本是废物。得换思路。

第二回合:直捣黄龙——官方平台

既然搜索不行,那直接去 openstd_samr_gov_cn(国家标准全文公开系统)总该有吧?

▲ 官方网站搜索结果:三个标准全部标注为”采标”

三个标准全找到了!但每个旁边都标着一个字——“采”

这个”采”是”采标”的意思,就是采用 ISO 国际标准。官方平台的声明写得很清楚:

“涉及采标的推荐性国家标准……将在遵守国际版权政策前提下进行公开。”

翻译成人话:ISO 爸爸有版权,不给你看。 😃

三个标准全是采标,官方渠道全军覆没。

第三回合:全网大搜捕

既然官方不给,那就只能去各种民间标准下载站找了。

我让 Reasonix 的子代理(research)去全网搜。它一口气帮我排查了十几个网站:

网站
状态
原因
学兔兔 bzfxwd_com
403,反爬虫
GBT标准网 gbt_org_cn
只有目录,跳转官方
道客巴巴 doc88_com
CAPTCHA 验证码墙
云标准 yunbiaozhun_com
404
标准网 biaozhun_org
404
电子标准网 eBiaozhun_com
找到了!

与此同时,研究子代理还发现了一个意外惊喜——GB/T 5117-2012 的直接 PDF 链接,托管在湖北某检测机构的网站上,一条 curl 命令就下载完了。

还剩两个,全在 eBiaozhun_com 上。战斗正式开始。

第四回合:与 eBiaozhun_com 斗智斗勇

打开 eBiaozhun_com 的标准页面,预览图只给看前 5 页。点”下载完整版”——

💰 请充值金币

你剩余金币: 0,下载需要金币: 0

等会儿。

需要金币: 0???

你要不要看看自己在说什么?0 金币的文档为什么要我充值?

这就像去便利店买一瓶标价 ¥0 的水,收银员说”请先充值会员卡”。

这个矛盾让我意识到一件事:这个文档很可能本来就是免费的,只是网站的前端逻辑强行弹了支付窗口。

突破:绕过前端的”楚门世界”

▲ 从 eBiaozhun_com 页面 JS 源码中发现 API 端点

前端弹窗骗得了人,骗不了 AI。我让 Reasonix 直接扒页面的 JS 源码:

// 从页面源码中找到的var pid = 236764;  // GB/T 8110-2020 的文档 ID// API 端点jQuery.get("/matrix/order/paystatus?type=doc&pid=" + pid)jQuery.get("/matrix/order/dobuy/.../method/coin/pid/" + pid)

嗯?有个 /matrix/order/paystatus 接口?

用 Python 直接调一下试试:

resp = session.get(    f'/matrix/order/paystatus?type=doc&pid=236764',    headers={'X-Requested-With': 'XMLHttpRequest'})

返回结果:

{  "code": 1,  "msg": "已支付!",  "data": {    "files": [{      "name": "GB∕T 8110-2020 ...焊丝.pdf",      "url": "https_//down_bootwiki_com/.../7f58f041...216f.pdf"    }]  }}

🎉 已支付。已支付?已支付!!!

我连账号都没注册,系统就说我”已支付”,还贴心地附上了直接下载链接。

这个 API 的校验逻辑大概是这样的:

if (文档价格 == 0) {    return "已支付";  // ← 直接放行,不检查登录状态}

后端程序员写这段代码时的心态我大致能体会:

“反正前端会拦着,后端就不做登录校验了吧……”

—— 一位不想加班的兄弟 🫡

💡 教训 #2:永远不要相信前端 UI。你看到的登录墙、支付弹窗,在 API 层可能形同虚设。

收获时刻

一通操作下来:

curl -L -o "GB_T_8110-2020.pdf" "https_//down_bootwiki_com/...216f.pdf"# ✅ 9.1 MBcurl -L -o "GB_T_39280-2020.pdf" "https_//down_bootwiki_com/...21450.pdf"# ✅ 3.9 MB
标准
文件
大小
来源
GB/T 5117-2012
GB_T_5117-2012.pdf
1.31 MB
检测机构网站
GB/T 8110-2020
GB_T_8110-2020.pdf
9.10 MB
bootwiki CDN
GB/T 39280-2020
GB_T_39280-2020.pdf
3.93 MB
bootwiki CDN

三个标准,总计约 14MB,全程 20 分钟,花了 ¥0.37。


总结:这次”白嫖”教会我的事

1. 搜索不行就直连。 对于中文标准文件这类垂直资源,Google 的索引就是灾难。直接用 curl 抓目标站点,比搜一百次有效。

2. 前端和后端是两个世界。 网站前端给你看的是精心设计的”付费漏斗”,后端 API 可能连最基本的鉴权都没有。AI 善于发现这种不一致——因为它读的是代码,不是 UI。

3. 0 是一个很有信息量的数字。 页面显示”需要金币: 0″时,大多数人的反应是忽略它然后关掉弹窗。但”0″意味着免费,免费意味着不应该有门槛——这个逻辑漏洞就是突破口。

4. curl + Python > 花里胡哨的工具。 在爬虫反爬的猫鼠游戏中,最朴素的 curl + 正则 往往比各种高级框架更灵活。毕竟对面防的是脚本小子,不是手搓 HTTP 请求的 AI。


🧬 彩蛋:我已经帮你打包成了 Skill

这次踩过的坑不能白踩。我把整个流程封装成了一个 Reasonix Skill——gb-downloader

下次你再需要下载国标,只需:

/skill gb-downloader

输入:

GB/T 8110-2020GB/T 39280-2020

AI 会自动:

  1. 搜索 eBiaozhun_com 找到文档
  2. 提取 pid 和 API 端点
  3. 调用 paystatus 接口获取真实下载链接
  4. 下载 PDF 到本地

全程不需要你碰浏览器、不需要注册、不需要付费。

你花 4 毛钱看我趟了雷,以后你就是免费下载了。这波不亏。😎

本文全程由 Reasonix Code 执行,模型 deepseek-v4-pro

API 调用成本合计约 $0.051(≈ ¥0.37)

Skill 文件已放在 GitHub 开源了,非程序员 GitHub 首秀,欢迎试用

如果你也有类似的”白嫖”经验,评论区聊聊?👇