乐于分享
好东西不私藏

强制下载网页上的资源,只需先分析网战源码.这系列就写到这儿算了.一个给普通人的简易互联网模型(完结)

强制下载网页上的资源,只需先分析网战源码.这系列就写到这儿算了.一个给普通人的简易互联网模型(完结)

昨天讲了暗网和电报这两个犯罪天堂,但是犯罪的东西咱不接触,咱也没有什么需求去用它。
对于咱们好人,一个更常见的需求可能是看到了想拿到。比方视频。最傻瓜的办法是录频,如果需要音频,后期再提取就可以了。但有些东西比如游戏啥的,还录频这些就没用了。
可以分析一下网页,右键然后查看源代码。现在的网页基本上分两大类,一类写死或者服务端渲染好的静态页面,查看源代码就可以看到所有的信息,有资源链接的话基本写在一个`<xxx src=…>`的标签里,src就是资源的来源source,一般是一个URL。这时候如果你知道迅雷是一家技术非常强的公司,其实遇到这些带有src属性的标签,直接copy过来丢进去,一般都会有惊喜的。可以写个脚本去扫描网页上的资源标签,现在AI发达了也可以丢给AI看,也可以肉眼扫描。
另一种网页查看源码的时候里面可能就几行,但是页面上的花哨功能却非常多,另外看地址栏一般也不是xxx.html,而是一个无后缀的路由,基本上就是所谓的动态网站了,当然写死那种也有动态的,只不过相比起来,那些是服务端渲染了整个页面后一起发过来,而这种属于局部刷新,服务端每次只发过来需要变化的部分。这都不是重点,重点是,在实现了局部刷新之后,闲的没事干的程序员玩起了加密,所以基本上这些刷新的数据都是加密的,要劫持下来,就得拟像它们的加密算法,然后把劫持到的数据解开。美化的话叫做爬虫,实际上似乎是一种骇客行为,有些人也叫它web逆向,或者web逆向爬虫。容易吃国家饭。pypi生态里什么算法都有人写好了,只要掌握操作步骤,谁都能成为逆向专家。
With great power comes great powder. 搜商越强,越容易吃国家饭。让我们就到此为止吧。反正也没人看。哎。再往上,那就是ffuf然后进去拿了,那我也不会,我也不敢。横向也有些扩展,像什么site: xxx, – && in filetype这些,不知道总共有多少,反正见一个捡一个吧。如果有人真的认真看我这一系列文章,祝你幸福。