Python Pandas:如何读取由头分隔的分组数据?

2024-09-22 16:38:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我在文本文件中有日期:

AL012015,               Kevin,     20,
20151108, 1800,  , XY, 22.2A,  71.5B,  30, 10,
20151108, 1800,  , XY, 22.2A,  71.5B,  30, 10,
20151108, 1800,  , ZZ, 22.2A,  71.5B,  30, 10,
AL022015,               Mike,     20,
20151108, 1800,  , XX, 22.2A,  71.5B,  30, 10,
20151108, 1800,  , YY, 22.2A,  71.5B,  30, 10,

我想读一下AL012015下的每一块,如下所示:

^{pr2}$

注意01和02是AL后面的两个数字


Tags: 数字mikealxy文本文件xxkevinyy
1条回答
网友
1楼 · 发布于 2024-09-22 16:38:33

我想你可以进行预处理。{cd1>在文件后面添加一个新的数字:

$ awk -F, '/^AL/ {AL=substr($1,3,2);next}{print AL","$0}' file.txt
01,20151108, 1800,  , XY, 22.2A,  71.5B,  30, 10,
01,20151108, 1800,  , XY, 22.2A,  71.5B,  30, 10,
01,20151108, 1800,  , ZZ, 22.2A,  71.5B,  30, 10,
02,20151108, 1800,  , XX, 22.2A,  71.5B,  30, 10,
02,20151108, 1800,  , YY, 22.2A,  71.5B,  30, 10,

然后,您可以使用pandas来更好地使用groupby操作。假设前面的输出是file2.txt,可以这样做:

^{pr2}$

我希望这能帮助你。在

敬上。在

相关问题 更多 >