如何更正python中的行值未对齐

df = ref name address 1 1.2 name1 2 1.2 address1 3 1.3 name2 4 1.3 name2 5 1.3 address2 6 1.3 address2 7 1.4 name3 8 1.4 name3 9 1.5 name4 10 1.5 address4

2条回答

网友

1楼 · 编辑于 2024-09-23 22:31:18

给定您可以运行的数据的确切格式：

data.set_index('ref').applymap(lambda x: np.nan if x=='' else x).apply(lamdba x: x.dropna())

这首先用NaN替换所有空单元格，然后一次取一列并删除所有NaN行。然后，通过在ref（现在是索引）上进行匹配，将它们合并为数据帧

如果您的数据中已经缺少NaN值，那么它只是

data.set_index('ref').apply(lamdba x: x.dropna().reset_index())

网友

2楼 · 编辑于 2024-09-23 22:31:18

我们可以执行groupby+shift NaN:PS您可以通过Divakar检查justify，以加快整个过程

pd.concat([ y.apply(lambda t : sorted(t,key=pd.notnull)).dropna(thresh=2) for x , y in df.groupby('ref') ])
Out[121]: 
    ref   name   address
2   1.2  name1  address1
5   1.3  name2  address2
6   1.3  name2  address2
7   1.4  name3       NaN
8   1.4  name3       NaN
10  1.5  name4  address4

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何更正python中的行值未对齐

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >