from selenium import webdriver     import string   &nb...
阅读(541) 评论(0)
  一 前言 在网站的采集过程中,每天都要面对网站的各种反爬虫技术,然而我们要想拿到数据,就需要针对性的制定很多方法来突破他们的反爬。例如...
阅读(365) 评论(0)
  虽然动态代理ip是数据采集过程中必不可少的,但是使用了动态切换ip,并不表示就一定不封ip.因为网站的反爬不仅仅是ip策略,还有cookie、ua甚至js统计分析等,这些都需要针对网站进行一些分析处理,否则只有ip就能将网站都采集下来,那么爬虫程序也就没啥难度了,事实上越是有价值的网...
阅读(638) 评论(1)