我在python
制作了一个网页刮板,告诉我何时从不同的赌博网站免费投注报价已更改或新增加的信息。在
然而,博彩公司倾向于记录与IP
流量和MAC
地址相关的信息,以标记匹配的优胜者。在
当使用urllib.request
模块中的Request()
方法时,如何欺骗我的IP
地址?在
我的代码如下:
req = Request('https://www.888sport.com/online-sports-betting-promotions/', headers={'User-Agent': 'Mozilla/5.0'})
site = urlopen(req).read()
content = bs4.BeautifulSoup(site, 'html.parser')
为了克服IP速率禁令和隐藏您的真实IP,您需要使用代理。有很多不同的服务提供代理。考虑使用它们作为自己管理代理是一个真正的头痛和成本会更高。我建议https://botproxy.net等。它们通过单个端点提供旋转代理。以下是如何使用此服务发出请求:
或使用请求库
^{pr2}$他们在不同的国家也有代理人。在
不久前我也遇到了同样的问题。这是我的代码片段,我正在使用它,以便匿名地抓取。在
这将创建一些正在工作的代理。这个部分:
^{pr2}$这将创建不同的“标题”,假装是浏览器。 最后但并非最不重要的是,只需将这些输入到request()中。在
希望能解决你的问题。在
否则请看这里:https://www.scrapehero.com/how-to-fake-and-rotate-user-agents-using-python-3/
干杯
这可能有助于匿名浏览。您可以使用一些免费的代理站点来获取代理并更新proxy={}。在
相关问题 更多 >
编程相关推荐