强制下载网页上的资源,只需先分析网战源码.这系列就写到这儿算了.一个给普通人的简易互联网模型(完结)-夜雨聆风

强制下载网页上的资源,只需先分析网战源码.这系列就写到这儿算了.一个给普通人的简易互联网模型(完结)

昨天讲了暗网和电报这两个犯罪天堂，但是犯罪的东西咱不接触，咱也没有什么需求去用它。

对于咱们好人，一个更常见的需求可能是看到了想拿到。比方视频。最傻瓜的办法是录频，如果需要音频，后期再提取就可以了。但有些东西比如游戏啥的，还录频这些就没用了。

可以分析一下网页，右键然后查看源代码。现在的网页基本上分两大类，一类写死或者服务端渲染好的静态页面，查看源代码就可以看到所有的信息，有资源链接的话基本写在一个`<xxx src=…>`的标签里，src就是资源的来源source，一般是一个URL。这时候如果你知道迅雷是一家技术非常强的公司，其实遇到这些带有src属性的标签，直接copy过来丢进去，一般都会有惊喜的。可以写个脚本去扫描网页上的资源标签，现在AI发达了也可以丢给AI看，也可以肉眼扫描。

另一种网页查看源码的时候里面可能就几行，但是页面上的花哨功能却非常多，另外看地址栏一般也不是xxx.html，而是一个无后缀的路由，基本上就是所谓的动态网站了，当然写死那种也有动态的，只不过相比起来，那些是服务端渲染了整个页面后一起发过来，而这种属于局部刷新，服务端每次只发过来需要变化的部分。这都不是重点，重点是，在实现了局部刷新之后，闲的没事干的程序员玩起了加密，所以基本上这些刷新的数据都是加密的，要劫持下来，就得拟像它们的加密算法，然后把劫持到的数据解开。美化的话叫做爬虫，实际上似乎是一种骇客行为，有些人也叫它web逆向，或者web逆向爬虫。容易吃国家饭。pypi生态里什么算法都有人写好了，只要掌握操作步骤，谁都能成为逆向专家。

With great power comes great powder. 搜商越强，越容易吃国家饭。让我们就到此为止吧。反正也没人看。哎。再往上，那就是ffuf然后进去拿了，那我也不会，我也不敢。横向也有些扩展，像什么site: xxx， – && in filetype这些，不知道总共有多少，反正见一个捡一个吧。如果有人真的认真看我这一系列文章，祝你幸福。