以pandas dataframe的形式读取url（python3）

import pandas as pd import io import requests url="http://archive.ics.uci.edu/ml/machine-learningdatabases/statlog/heart/heart.dat" s=requests.get(url).content header_row = ['age','sex','chestpain','restBP','chol','sugar','ecg','maxhr','angina','dep','exercise','fluor','thal','diagnosis'] c=pd.read_csv(io.StringIO(s.decode('utf-8')), names=header_row) print(c)

1条回答

网友

1楼 · 发布于 2024-10-01 04:46:06

您提供的链接缺少连字符。我已经在我的回答中更正了这一点。基本上，您需要将s字符串解码为utf-8，然后在\n上拆分它以获得每一行，然后在空白处拆分每一行以分别获得每个值。这将为您提供数据集的嵌套列表表示形式，您可以将其转换为pandas数据帧，然后可以分配列名。在

import pandas as pd
import io
import requests
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/statlog/heart/heart.dat"
s = requests.get(url).content
s = s.decode('utf-8')
s_rows = s.split('\n')
s_rows_cols = [each.split() for each in s_rows]
header_row = ['age','sex','chestpain','restBP','chol','sugar','ecg','maxhr','angina','dep','exercise','fluor','thal','diagnosis']
c = pd.DataFrame(s_rows_cols, columns = header_row)
c.head()

相关问题更多 >

编程相关推荐

热门问题

热门文章