将数据从网站获取到python

2024-09-30 18:13:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要从这个网站https://www.tsa.gov/coronavirus/passenger-throughput访问这个表

我需要把这个表作为一个数据框

以前,我只处理已经是xls或csv的URL,所以我不知道如何从普通网站获取表格

救命啊


Tags: csv数据httpsurl网站wwwxls表格
1条回答
网友
1楼 · 发布于 2024-09-30 18:13:32

我将尝试提供起点。您可以查看official documentation以了解更多详细信息

from bs4 import BeautifulSoup
from urllib.request import Request, urlopen

req = Request('https://www.tsa.gov/coronavirus/passenger-throughput',  headers={'User-Agent': 'Mozilla/5.0'})
html = urlopen(req).read()

soup = BeautifulSoup(html, 'html.parser')
for row in soup.find_all('tr'):
    print(row)

输出如下所示:

 <tr><td><strong>Date</strong></td><td><strong>Total Traveler Throughput</strong></td><td><strong>Total Traveler Throughput<br/>(1 Year Ago - Same Weekday)</strong></td></tr>
 <tr><td>4/21/2020</td><td>92,859</td><td>2,227,475</td></tr>
 <tr><td>4/20/2020</td><td>99,344</td><td>2,594,171</td></tr>
 <tr><td>4/19/2020</td><td>105,382</td><td>2,356,802</td></tr>
 <tr><td>4/18/2020</td><td>97,236</td><td>1,988,205</td></tr>
 <tr><td>4/17/2020</td><td>106,385</td><td>2,457,133</td></tr>

相关问题 更多 >