我使用的是一个复杂的数据集,包含数百列,有时甚至数千列。它们中的许多是NaN,并且系统地如此(它们往往在nulls分布的方式上高度相关)。这使我相信,对南斯的目视检查是一个良好的开端。我能行
dataframe.count()
获取每列中出现的值的数量,但我不知道它们的分布。在
所以我想制作一个散点图,它可以直观地反映数据帧的布局,并且该点要么被着色为NaN,要么为一个实际值留空。这样我就可以看到趋向于聚集在一起的nan模式。不过,我不知道如何在matplotlib上这样做。在
换言之,我该如何策划
^{pr2}$在散点图中,X轴是标签,Y轴是索引?在
另外,如果您知道任何其他检查数据帧中空值的“模式”的方法,请与我分享。谢谢!在
明白了!热图是我想要的
如果你想要更像“散点图,直观地反映数据帧的布局”
你可以试试
matplotlib.pyplot.spy
相关问题 更多 >
编程相关推荐