Pandas：在bar上同时使用log和stack p

网友

1楼 · 编辑于 2024-07-01 08:26:55

用刻度线来避免用刻度线在绘图时出现的问题。有了这个，你可以用相同的比例尺来比较每个小节。但你需要一个更长的数字（5倍以上）。简单地stacked=False。示例数据：

网友

2楼 · 编辑于 2024-07-01 08:26:55

为了使条形图的总高度保持在对数刻度上，但条形图中类别的比例是线性的，可以重新计算堆积数据，使其在对数刻度上呈线性。在

作为一个示例，让我们选择6个具有非常不同总计（[5,10,50,100,500,1000]）的数据集，这样在线性比例下，较低的条形图将非常小。让我们把它分成30%、50%和20%的部分（为了简单起见，所有不同的数据按相同的比例划分）。在

然后，我们可以计算出每个数据点的大小，这些数据点以后应该出现在堆积条形图上，这样30%、50%和20%的比率保留在对数比例图中，最后绘制这些新创建的数据。在

from __future__ import division 
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

a = np.array([5,10,50,100,500,1000])

p = [0.3,0.5,0.2]
c = np.c_[p[0]*a,p[1]*a, p[2]*a]

d = np.zeros(c.shape)
for j, row in enumerate(c):
    g = np.zeros(len(row)+1)
    G = np.sum(row)
    g[1:] = np.cumsum(row)
    f = 10**(g/G*np.log10(G))
    f[0] = 0
    d[j, :] = np.diff( f )

collabels = ["{:3d}%".format(int(100*i)) for i in p]     
dfo = pd.DataFrame(c, columns=collabels)
df2 = pd.DataFrame(d, columns=collabels)

fig, axes = plt.subplots(ncols=2)

axes[0].set_title("linear stack bar")
dfo.plot.bar(stacked=True, log=False, ax=axes[0])
axes[0].set_xticklabels(a)

axes[1].set_title("log total barheight\nlinear stack distribution")
df2.plot.bar(stacked=True, log=True, ax=axes[1])
axes[1].set_xticklabels(a)
axes[1].set_ylim([1, 1100])
plt.show()

最后一句话：我认为这样的情节应该小心。它可能对检查有用，但我不建议向其他人展示这样一个图，除非你能确保他们完全理解所画的内容和如何阅读它。否则，这可能会引起很多混乱，因为堆叠的类别的高度与比例不匹配，这只是一个错误。显示虚假数据会带来很多麻烦！在

网友

3楼 · 编辑于 2024-07-01 08:26:55

没有数据的两个建议（提供样本数据更好）

选项1
使用value_counts(normalize=True)

brandScore = swissDF.groupby(['brand', 'overall'])['brand']
brandScore = brandScore.value_counts(normalize=True).unstack('overall')
brandScore.plot(kind='bar', stacked=True, figsize=(8,6))

选项2
除以行和

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章