一个python类,用作proxychraw抓取和抓取api的包装器

proxycrawl的Python项目详细描述


ProxyCrawl API Python类

一个轻量级的、无依赖关系的python类,充当proxychraw api的包装器。

安装

选择安装方式:

  • 从github下载python类。
  • 或者使用PyPipython包管理器。pip install proxycrawl

然后导入ProxyCrawlAPI

Python2:

fromproxycrawlimportProxyCrawlAPI

Python3:

fromproxycrawl.proxycrawl_apiimportProxyCrawlAPI

类用法

首先初始化ProxyCrawlAPI类

api=ProxyCrawlAPI({'token':'YOUR_PROXYCRAWL_TOKEN'})

获取请求

传递您要删除的url以及API documentation中可用的选项。

api.get(url,options={})

示例:

response=api.get('https://www.facebook.com/britneyspears')ifresponse['status_code']==200:print(response['body'])

您可以从ProxyCrawl API传递任何选项。

示例:

response=api.get('https://www.reddit.com/r/pics/comments/5bx4bx/thanks_obama/',{'user_agent':'Mozilla/5.0 (Windows NT 6.2; rv:20.0) Gecko/20121202 Firefox/30.0','format':'json'})ifresponse['status_code']==200:print(response['body'])

发布请求

传递要刮除的url、要发送的数据(可以是json或字符串)以及API documentation中可用的选项。

api.post(url,dictionaryorstringdata,options={})

示例:

response=api.post('https://producthunt.com/search',{'text':'example search'})ifresponse['status_code']==200:print(response['body'])

通过将选项post_content_type设置为json,可以将数据发送为application/json,而不是x-www-form-urlencoded

importjsonresponse=api.post('https://httpbin.org/post',json.dumps({'some_json':'with some value'}),{'post_content_type':'json'})ifresponse['status_code']==200:print(response['body'])

Javascript请求

如果你需要删除任何用javascript构建的网站,比如react、angular、vue等,你只需要传递javascript令牌并使用相同的调用。注意,只有.get可用于javascript,而不是.post

api=ProxyCrawlAPI({'token':'YOUR_JAVASCRIPT_TOKEN'})
response=api.get('https://www.nfl.com')ifresponse['status_code']==200:print(response['body'])

同样,您可以传递javascript附加选项。

response=api.get('https://www.freelancer.com',{'page_wait':5000})ifresponse['status_code']==200:print(response['body'])

原始状态

您始终可以从响应获取原始状态和代理爬网状态。阅读ProxyCrawl documentation了解有关这些状态的更多信息。

response=api.get('https://craiglist.com')print(response['headers']['original_status'])print(response['headers']['pc_status'])

如果您有问题或需要使用库的帮助,请打开问题或contact us


2019 ProxyCrawl版权所有

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何通过解决错误“活动无法转换为片段”将片段传递给类构造函数?   Java中清理Code39条码数据的regex帮助   将java转换为C++   java无法在Android Studio中生成签名的apk,出现错误   从数学方程出发   MySQL和Java内存问题   如何强制Java抛出算术异常?   java为什么JDBC将零端口视为空(默认)端口?   java如何在没有“changelog主题”的情况下加入KStream和KTable   排序我尝试合并两个排序的数组,但得到的是java。lang.ArrayIndexOutofBounds异常:5无法找出原因   如何在java中求大长度矩阵的逆?   基于maven构建的java生成类路径字符串   java每20个字符分割一个字符串,然后将每个部分打印到控制台   将字符串数字字转换为字符串数字:Java   在特定区域使用混合类型的java填充字节数组   尽管java类在开关块中实例化,但它只能调用接口方法