Pandas:read_csv,在看似规则的d上标记数据时出错

2024-09-25 20:16:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从以下位置读取elnino数据集: https://archive.ics.uci.edu/ml/machine-learning-databases/el_nino-mld/el_nino.data.html

但是,我得到了“错误标记数据”。使用写字板打开数据时,数据本身如下所示:

1 1   8.96 -140.32 -6.3  -6.4  83.5 27.32 27.57
1 2   8.95 -140.32 -5.7  -3.6  86.4 26.70 27.62
1 3   8.96 -140.32 -6.2  -5.8  83.0 27.36 27.68
1 4   8.96 -140.34 -6.4  -5.3  82.2 27.32 27.70
1 5   8.96 -140.33 -4.9  -6.2  87.3 27.09 27.85
1 6   8.96 -140.33 -6.3  -4.9  91.5 26.82 27.98
1 7   8.97 -140.32 -6.7  -3.7  94.1 26.62 28.04
1 8   8.96 -140.33 -6.3  -4.8  92.0 26.89 27.98 
1 9   8.97 -140.33 -6.3  -4.9  86.9 27.44 28.13
1 10  8.97 -140.32 -4.2  -2.5  87.3 26.62 28.14
1 11  8.96 -140.32 -6.8  -2.4  86.0 27.60 28.09
1 12  8.96 -140.33 -7.1  -3.2  82.2 27.87 28.15
1 13  8.96 -140.33 -6.7  -4.7  81.3 27.75 28.19

在我看来没问题。到目前为止,我尝试过:

^{pr2}$

输入数据有什么问题?在


Tags: 数据httpsdatamachineelmldatabaselearning
1条回答
网友
1楼 · 发布于 2024-09-25 20:16:39

在刚刚读了前几行之后,我注意到了几个由sep=' | | |\t'引起的nan。三个空格被解释为“[sep]nan[sep]”。在

解决方案是:

df = pd.read_csv('elnino', sep=' *', header=None)

编辑:注意到这可能是一个更合适的解决方案: df=pd.read_csv文件('elnino',delim\u whitespace=True,header=None)

相关问题 更多 >