当我执行get请求时,我会得到翻译的文本(在Python中)。如何获取英语内容?

2024-09-28 03:16:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从网上搜刮this page找乐子。在

剧本运行得很好,但有些电影的名字被翻译成罗马尼亚语(例如,“美女与野兽”“Frumoasa si Bestia”)。在

我猜服务器会根据我的IP向我发送请求的内容。在

然而,在我的浏览器中,我只能看到英文名称,无论我是使用我的IP还是通过浏览器的扩展激活VPN。这可能是因为浏览器的语言设置为“英语”,而“翻译”选项处于禁用状态。在

我的问题是:如何获得所有英文名字?在

我可以在我的GET请求中指定一些参数来执行此操作吗?在

import requests
page = requests.get(some_URL)

我也在考虑使用服务器VPN(不仅仅是一个浏览器扩展),但是我在Lubuntu上运行,在安装一个免费的VPN(需要创建帐户等)时似乎有很多令人头疼的问题。在

如果有帮助的话,我用Jupyter笔记本来编写代码。在


Tags: ip服务器电影page浏览器vpnthis名字
1条回答
网友
1楼 · 发布于 2024-09-28 03:16:40

我想这个网站是基于浏览器语言的网页。尝试在请求时设置:

import requests

url = r"http://www.imdb.com/search/title?release_date=2017&page=1&ref_=adv_nxt"
headers = {"Accept-Language": "en-US,en;q=0.5"}
r = requests.get(url, headers=headers)

顺便说一下。检查imdb web scrape的策略。在

相关问题 更多 >

    热门问题