在Pandas数据帧中目视检查NaNs

2024-09-29 23:27:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是一个复杂的数据集,包含数百列,有时甚至数千列。它们中的许多是NaN,并且系统地如此(它们往往在nulls分布的方式上高度相关)。这使我相信,对南斯的目视检查是一个良好的开端。我能行

dataframe.count()

获取每列中出现的值的数量,但我不知道它们的分布。在

所以我想制作一个散点图,它可以直观地反映数据帧的布局,并且该点要么被着色为NaN,要么为一个实际值留空。这样我就可以看到趋向于聚集在一起的nan模式。不过,我不知道如何在matplotlib上这样做。在

换言之,我该如何策划

^{pr2}$

在散点图中,X轴是标签,Y轴是索引?在

另外,如果您知道任何其他检查数据帧中空值的“模式”的方法,请与我分享。谢谢!在


Tags: 数据dataframe数量高度count方式模式布局

热门问题