我正在尝试使用BeautifulSoup提取以下网页上的表:
https://www.indiapost.gov.in/VAS/Pages/PMODashboard/DistributionOfPostOffices.aspx
我尝试使用的代码是:
import pandas as pd
from urllib.request import urlopen
from bs4 import BeautifulSoup
url = "https://www.indiapost.gov.in/VAS/Pages/PMODashboard/DistributionOfPostOffices.aspx"
html = urlopen(url)
soup = BeautifulSoup(html, 'lxml')
type(soup)
table = soup.find('table', {'class' : 'tbl'})
#extract rows:
rows = soup.find_all('tr')
最后一行应该沿着带有HTML标记的行名打印输出(如Sl No、Head Post Office等),但它只打印一个空列表。我哪里出错了?你知道吗
您可能需要遵循以下方法,使用请求从该网页获取表格内容。事实证明,您要查找的内容在这个link中可用,您可以使用chrome开发工具找到它。你知道吗
工作代码:
输出如下:
相关问题 更多 >
编程相关推荐