如何处理中的元数据行pandas.read_csv?

2024-09-28 22:20:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个txt文件,它有一个元数据头,后面是csv样式的实际数据。数据包含带逗号的浮点数。像这样:

title = someTitle
date = 20.0.2019
col= str1 str2 str3
2,49 42,01 -0,50
5,74 11,03 -0,43
....

我需要pandas(0.24.0)中的全部信息,并希望数据是浮动的。在

^{pr2}$

在这种情况下,decimal选项没有任何区别。我总是有线绳。没有元数据,它工作得很完美。e、 g.签字人:

pd.read_csv(...,skiprows=3)

在我看来,熊猫似乎是从第一行开始的。在

那么,如何让熊猫忽略元数据呢?在


Tags: 文件csv数据txtpandasdatetitle样式
1条回答
网友
1楼 · 发布于 2024-09-28 22:20:11

read_csv可以从类似文件的对象中读取,因此您应该打开该文件,读取3行作为标题,提取列名,并选择在read_csv中使用它们。此外,您可以使用dtype选项强制数据类型。代码可以是:

with open(path) as fd:
    headers = [ next(fd) for i in range(3) ]
    df = pd.read_csv(fd, sep=' ', decimal=',', dtype=np.float, names=...)

如果需要,可以使用标题部分设置列名:

^{pr2}$

你会得到:

   str1   str2  str3
0  2.49  42.01 -0.50
1  5.74  11.03 -0.43

相关问题 更多 >