基于pandas数据fram中特定列中的值提取列值

2024-09-28 19:04:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧,其中dx1-dx99有99列,px1-px99有99列,mort有一列:

dx1 dx2 dx3 .   dx99    px1 px2 .   px99    mort
E10 I12 E10 N18 R18     0FY 0TY 0DN 0DN      1
E10 I12 I31 E44 N17     0FY 0TY 0FT 5A1      0
E10 I12 N17 T86 T86     0TY 0FY 0DT          0
I12 E10 N18 A04         0TY 0FY 0DT 0T7      1
E10 I12 E10 N18 Z99     0TY 0FY              0
E10 N18 Z76             0FY 0TY 04Q 0D1      1
E10 N18 Z99 N25 E78     0TY 0FY 0WP          0

我希望保留dx-dx99和px-px99中的所有值,其中匹配行中mort的值为1,否则将它们设置为零。然后计算剩余代码的出现频率。在

我试过了:

^{pr2}$

我在死亡专栏里什么也没看到。有什么想法吗?在


Tags: 数据n18dx2n17dx99i12dx3e10
1条回答
网友
1楼 · 发布于 2024-09-28 19:04:54

IIUC:

In [31]: x.loc[x.mort != 1, x.columns != 'mort'] = ''

In [32]: x
Out[32]:
   dx1  dx2  dx3  dx4 dx99  px1  px2  px3 px99  mort
0  E10  I12  E10  N18  R18  0FY  0TY  0DN  0DN     1
1                                                  0
2                                                  0
3  I12  E10  N18  A04  NaN  0TY  0FY  0DT  0T7     1
4                                                  0
5  E10  N18  Z76  NaN  NaN  0FY  0TY  04Q  0D1     1
6                                                  0

相关问题 更多 >