Matplotlib如何选择在密集散点图中覆盖哪些标记?

2024-05-18 17:43:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在处理一个相当大的数据集,其中包含x、y和z。x和y放在散点图上,z设置为色条值。共有24个不同的列,每列约有20000个点。我试图确定占主导地位的z值与y值的关系,但我不想被产生的图像中清晰的颜色所误导。考虑到一列中有这么多标记,我想知道Matplotlib是如何确定哪些标记覆盖在其他标记上的

这可能很难可视化,所以这里是我的代码和输出的图像。如果我们看第24小时,我们会看到主要的低海拔颜色,但我不想假设高海拔被低海拔值覆盖。假设低海拔地区在那个时段占主导地位是错误的,还是有什么我应该尝试澄清的?请记住,在这一列中大约有20000个点,所以掩盖的可能性不是零

enter image description here

我还没有找到一个明确的答案,所以我非常感谢任何帮助


Tags: 数据代码标记图像关系matplotlib颜色可视化
1条回答
网友
1楼 · 发布于 2024-05-18 17:43:11

你的问题的实质似乎是在你的陈述中,“我试图确定相对于y值的主导z值。”这是一个关于任何给定y值的z值的相对频率的问题(隐式地对于固定x值)。此外,数据集的大小从根本上限制了您对使用颜色条方案显示z值的确定性

我的建议是,对于每个x值,生成y和z的2D直方图,以显示任意给定y的主z。可以使用hist2d生成彩色编码的二维直方图。或者,如果您更喜欢相同类型数据的“3D”显示,您可以制作一个3D bar graph

显然,这种方法的缺点是将显示的维度增加1。这可能是不可接受的,但通过观察几个x值的结果,您可能会得到原始问题的答案,即颜色条是否是z优势的有效指示器

相关问题 更多 >

    热门问题