我正试图从这个网站上获取表数据:https://www.playnj.com/atlantic-city/revenue/
然而,当我试图打印该表时,它没有返回任何结果。有人能帮我吗
这是我的密码:
from bs4 import BeautifulSoup
import requests
import pandas as pd
base_url = 'https://www.playnj.com/atlantic-city/revenue/'
resp = requests.get(base_url)
soup = BeautifulSoup(resp.text, "html.parser")
october_table = soup.find('table', {'id': 'tablepress-342-no-2'})
print(october_table)
如果我的目标是从所有表中获取所有数据,那么使用与所有表相同的类包装器会更有效,我不确定为什么——理想情况下(这里可能我错了)——我会使用以下两行代码(但可能不是)
all_tables = soup.findAll('table', {'class': 'dataTables_wrapper no-footer'})
print(all_tables)
然而,这也不会返回任何结果。我们将非常感谢您的帮助
似乎此页面检查了
User-Agent
标题它甚至可以在不完整的
"User-Agent": "Mozilla/5.0"
中工作顺便说一句:此表具有不同的ID:
'id': 'tablepress-342'
结果
输出:
CSV文件:view-online
带有标题的请求:
相关问题 更多 >
编程相关推荐