基于第二列值的Python差异数据解释

2024-06-28 15:56:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在解释和创建类似标题的数据帧。但不知道如何处理每行的不同标题。你知道吗

我有一个很大的文本文件abcde.txt文件你知道吗

文件中显示的数据格式如下所示:(第二列的值说明了其余的格式,并且不同列的标题名称不同#2类型)

DATA, 0 , timestamp, (set of 5 numbers(A,B,C,D,E) data repeated multiple times.)
DATA,1 timestamp (set of 4 numbers (AA, BB,CC,DD) repeated  multiple times)
DATA,2, timestamp (set of 3 numbers (AAA, BBB,CCC) repeated multiple times)
DATA, 3 , timestamp (set of 6 numbers repeated multiple times ))

列#2的值最多为5。和文件有多行相同的列类型。你知道吗

示例:

DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…

:::::

编辑:

关于这个问题,我尽量不作进一步的解释

所以我想根据第二列的值(可以是0到5)来制作单独的数据帧进行分析。你知道吗

如果您在示例中看到第二列has value==0(行#1),这是5头格式,因此我想准备5个值并在数据帧中创建一行,读取同一行中的下5组值,并将行插入到具有重复时间戳的数据帧中。因此,如果5值集重复10次,它将是10X(5+1(对于时间戳))维数据帧。我必须对第二列的值==0的所有行重复这个步骤,并将它添加到数据帧中,以生成第二列==0的完整数据帧。你知道吗

 Something like this: (this is the data frame where second column value ==0)
Header:             timestamp      A    B   C    D    E 
                    12345          A1   B1  C1   D1   E1
                    12345          A2   B2  C2   D2   E2
                    12345          A3   B3  C3   D3   E3
(new line in file)  14567          A4   B4  C4   D4   E4
                    14567          A5   B5  C5   D5   E5
                    14567          A6   B6  C6   D6   E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.

Tags: 文件of数据标题datamultiplerepeatedtimestamp