组织Pandas数据帧信息的最有效方法

2024-09-30 02:36:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我想存储在pandas dataframe上的数据结构可以表示为:

        F1    F2     F3 . . . .

a
b
c
t1
t2
.
.
t18000
x1
x2
.
.
x18000
y
z

当我想可视化行只是为了了解数据帧包含什么信息时,我不想看到18000T或x变量。相反,我想要的是:【a,b,c,t,x,y,z】

我对Pandas模块不太熟悉,所以我的问题是,我应该如何存储这些信息,以便在将来达到上面提到的行名称?更具体地说:

  • 我应该把t和x值作为数组存储在一个单元格中吗?在

                 F1                F2        ...
    a
    b
    c
    t [t1 t2 .. t18000]
    x [x1 x2 .. x18000]
    y
    z                                                    
    
  • 或者,是否有一种内在的方式来可视化与pandas中相同行名称的多个索引?


Tags: 名称信息数据结构dataframepandas可视化f2f1
1条回答
网友
1楼 · 发布于 2024-09-30 02:36:54

有几种方法可以做到。您可以使用Multiindex,它允许您创建层次索引。例如:

df = pd.DataFrame({'F1': range(4)}, index=[['x', 'x', 'y', 'y'], ['x1', 'x2', 'y1', 'y2']])

将为您提供如下数据帧:

^{pr2}$

您可以简单地groupby级别,例如求和,df.groupby(level=0).sum()

另外,如果你不想在cd1>函数中使用。例如,要按索引中的第一个字符分组:

df = pd.DataFrame({'F1': range(4)}, index=['x1', 'x2', 'y1', 'y2'])
df.groupby(lambda index: index[0]).sum()

相关问题 更多 >

    热门问题