我有一个可以有大量列的数据帧。每列的名称是3个相同的字符,后跟第四个唯一的字符。我试图查看每个列的“组”,以确定它们是否为“-”。如果为空,我只想用“X”填充每列中的每个元素
前测向:
aaa1 aaa2 aaa3 aaa4 bbb1 bbb2 bbb3 bbb4 ccc1 ccc2 ddd1 ggg1 ggg6 ggg8 fff9
- - - - 1 x a - c - a 3 - - -
- - - - s z 1 a 2 - - - - h -
- - - - - x i - c - a 3 - - -
- - - - - - - - - f - 2 - 2 -
在本例中,有两个“空白”组—aaa、fff
结果df如下:
aaa1 aaa2 aaa3 aaa4 bbb1 bbb2 bbb3 bbb4 ccc1 ccc2 ddd1 ggg1 ggg6 ggg8 fff9
X X X X 1 x a - c - a 3 - - X
X X X X s z 1 a 2 - - - - h X
X X X X - x i - c - a 3 - - X
X X X X - - - - - f - 2 - 2 X
我失去的部分是如何将列作为组进行比较。任何想法都会有帮助。你知道吗
尝试groupby
filter
和.loc
赋值你可以试试这个:
输出:
详情:
all
检查列中的所有值是否为真。你知道吗loc
与筛选的datacolumn一起使用,并指定“X”。你知道吗相关问题 更多 >
编程相关推荐