无法使用BeautifulSoup刮取此电影网站

1条回答

网友

1楼 · 发布于 2024-09-28 23:32:21

此服务器正在检查Referer标头。如果没有Referer，则发送主页面。但是它不检查这个头中的文本，所以它甚至可以是空字符串。在

import requests
import bs4

headers = {
    #'Referer': any url (or even random text, or empty string)

    #'Referer': 'http://google.com',
    #'Referer': 'http://www.21cineplex.com',
    #'Referer': 'hello world!',
    'Referer': '',
}

s = requests.get('http://www.21cineplex.com/nowplaying', headers=headers)
soup = bs4.BeautifulSoup(s.text)

for x in soup.find_all('ul', class_='w462'):
    print(x.text)

for x in soup.select('ul.w462'):
    print(x.text)

for x in soup.select('ul.w462'):
    print(x.select('a')[0].text)
    print(x.select('p')[0].text)

编程相关推荐

java Sonarqube测试覆盖率过滤器（jacoco）
java演示文稿将被取消，因为自创建以来显示度量已更改
java为什么Omnifaces Websocket<o:socket>不能与Websphere 9一起使用？
我试图读取java中的xml，但在我的系统中出现了一个错误
java异步支持未启用，即使默认情况下应该启用
java getThreadHandler方法无法从HandlerThread实例访问
带成员函数的多线程Java启动线程
java jar非法参数
java以编程方式注册@Component注释类
正则表达式如何在java中查找字符串中的长双精度数

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法使用BeautifulSoup刮取此电影网站

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >