scrapy中间件为每个请求设置一个随机用户代理。

scrapy-random-ua的Python项目详细描述


你的小蜘蛛被服务器识别和阻止是因为 您使用默认的用户代理还是通用的用户代理?

使用这个random_useragent模块并为 每一个请求。

安装

安装非常简单。

pipinstallgit+https://github.com/cleocn/scrapy-random-useragent.git

用法

settings.py文件中,更新DOWNLOADER_MIDDLEWARES 像这样变化无常。

DOWNLOADER_MIDDLEWARES={'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware':None,'random_useragent.RandomUserAgentMiddleware':400}

这将禁用默认的UserAgentMiddleware,并启用 RandomUserAgentMiddleware

现在,来自爬虫程序的所有请求都将有一个随机用户代理。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
if语句Java中if(x(y))中x的结果类型是什么?   java TestNG没有执行套件中的所有测试类   java当使用自定义arrayadapter在listview中单击edittext时,会发生错误   java keytool命令的import和importcert之间有什么区别   java如何在流中使用PartitioningBy来查找高于或低于平均值的值?   java在从另一个Jtable中选择行时显示Jtable中的数据   java使用JOptionPane按钮创建条件状态   安卓“java.lang.UnsatisfiedLinkError:未找到本机方法:”如果删除头文件,可以修复错误?   java如何实现具有泛型关系的多态JPA实体   java当关闭相关(相同)的entityManager时,entityManager以前找到或获取的entites是什么?   运行应用程序时发生java UnsatifiedPendencyException异常   java如何在jfree折线图中添加注释