使用Pandas,如何读取zip文件中的csv文件,使用url[Python]获取该文件

2024-09-30 05:26:16 发布

您现在位置:Python中文网/ 问答频道 /正文

此url https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip

包含2个csv文件和1个每日更新的pdf文件,其中包含新冠病毒-19数据

我希望能够将Summary_stats_all_locs.csv作为数据帧加载

通常,如果有一个指向csv的url,我可以直接使用df = pd.read_csv(url),但是由于csv位于zip中,我不能在这里这样做

我该怎么做

谢谢


Tags: 文件csv数据httpscoreurlnetpdf
1条回答
网友
1楼 · 发布于 2024-09-30 05:26:16

您需要首先获取文件,然后使用ZipFile模块加载它。Pandas实际上可以从zip中读取CSV,但这里的问题是存在多个CSV,因此我们需要对此进行修改并指定文件名

import requests
import pandas as pd
from zipfile import ZipFile
from io import BytesIO

r = requests.get("https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip")
files = ZipFile(BytesIO(r.content))
pd.read_csv(files.open("2020_05_16/Summary_stats_all_locs.csv"))

相关问题 更多 >

    热门问题