Pandas/Groupby/Apply优化

1条回答

网友

1楼 · 发布于 2024-10-02 18:19:32

感谢RichieV的两个建议。我最终使用了这两个技巧，并最终做到了以下几点：

第一节将数据集按cols分成两部分，我在25岁时这样做，因为带NaN值的重复cols就是在这里结束的：

    sec1 = filtered_data.iloc[:,:25]
    sec2 = filtered_data.iloc[:,25:]

然后将数据帧的第一部分分解为变量&；值列在保留标题列的同时，这比熔化整个数据帧要快：

    sec1 = sec1.melt(id_vars=header_cols)

接下来，您只需删除在任何列中具有空值的任何行的NA，主要是在值列中：

    sec1 = sec1.dropna(axis='index', how='any') #remove rows with empty fields

最后将其向后旋转并连接2个拆分数据帧：

    sec1 = sec1.pivot_table(index= header_cols,
                   columns='variable',
                   values='value',
                   aggfunc='first')
    sec1 = sec1.reset_index()
    sec1 = sec1.rename_axis(None, axis=1)
    filtered_data = p.concat([sec1, sec2], axis=1)

再次感谢RichieV提供的宝贵建议

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas/Groupby/Apply优化

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >