实例讲解Style–CSS 在反爬虫中的应用

2023-05-22,,

由于这个例子比较简单,所以这里我就省略掉分析请求的步骤了,直接来分析一下浏览器看到的效果与源码分别长什么样,找找有没有什么突破口吧。

这是浏览器看到的效果:


可以在源码中看到部分内容被
<span class="context_kwx"></span> 替换。

页面分析

打开浏览器的
开发者模式,看看隐藏的文字是什么样子的:


第二个是下图中在返回时的判断语句,同样是对 Node 中不存在的属性进行判断,所以也需要在这里进行相应的修改。


第二个修改点可以像这样改:

_0x1532b6[_0xea12('0x26')](_0x490c80, 0x3 * +!('object' === _0xea12('0x27')))复制代码

以上两点修改完后就可以获取到所有被替换过的字符了,接下来只需要把它们替换进 HTML 里就可以还原出正常的页面。替换的步骤这里就不再演示了,因为非常简单,一看就会。当然反爬虫有很多的方法,这个只是其中一个,所以只是大概的讲述了下。但是不管使用什么方式采集数据都是一个长期的过程,所以需要配合代理才能更好的获取数据,而亿牛云提供的爬虫代理就能更好的助力我们进行数据采集,尤其是加强版,效果会更好。

《实例讲解Style–CSS 在反爬虫中的应用.doc》

下载本文的Word格式文档,以方便收藏与打印。