从python生成矩阵格式

2024-10-05 15:25:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据框B中有以下数据:

F1     F2    Count
A      C      5
B      C      2
B      U      6
C      A      1

我想用它们做一个方阵,结果是:

    A    B   C  U
A   0    0   6  0
B   0    0   2  6
C   6    2   0  0
U   0    6   0  0

我最初使用pd.crosstab(),但矩阵中缺少F1/F2中的一些变量

AC=5 CA=1,因此输出应为6

另外,pdcrosstab()不识别BU = UB

有人能帮忙吗?我对python基本上是新手

顺便说一句,这是我的代码:

wow=pd.crosstab(B.F1, 
            B.F2, 
            values=B.Count, 
            aggfunc='sum',
            ).rename_axis(None).rename_axis(None, axis=1)

Tags: 数据nonecount矩阵accaf2f1
3条回答

您可以将列F1F2分类,并使用crosstab进行工作

FDtype = pd.CategoricalDtype(list("ABCU"))

df[["F1", "F2"]] = df[["F1", "F2"]].astype(FDtype)
count = pd.crosstab(df["F1"], df["F2"], df["Count"], aggfunc='sum', dropna=False)
count.fillna(0, inplace=True, downcast="infer")
count += count.T

备注:在构造数据帧时指定列数据类型更有效

您可以pd.concatwowwow.T然后groupby索引和sum再次:

>>> wow=pd.crosstab(B.F1, 
            B.F2, 
            values=B.Count, 
            aggfunc='sum',
            ).rename_axis(None).rename_axis(None, axis=1)
>>> wow
     A    C    U
A  NaN  5.0  NaN
B  NaN  2.0  6.0
C  1.0  NaN  NaN

>>> pd.concat([wow, wow.T], sort=True).fillna(0, downcast='infer').groupby(level=0).sum()
   A  B  C  U
A  0  0  6  0
B  0  0  2  6
C  6  2  0  0
U  0  6  0  0

您可以将'F1''F2'交换的数据帧附加到原始数据帧

df1 = df.append(df.rename({'F1': 'F2', 'F2': 'F1'}, axis=1), sort=False)

然后您可以使用pivot_table

pd.pivot_table(df1, values='Count', index='F1', columns='F2', aggfunc='sum', fill_value=0)

crosstab

pd.crosstab(df1.F1, df1.F2, df1.Count, aggfunc='sum').fillna(0)

最后删除列和索引名:

del df1.columns.name, df1.index.name

结果:

   A  B  C  U
A  0  0  6  0
B  0  0  2  6
C  6  2  0  0
U  0  6  0  0

相关问题 更多 >