带Seaborn/Matplotlib的分组条形图

2024-10-05 10:46:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我的目标是创建一个像下面这样的分组条形图,使用pandas数据框,它由两个变量“Alpha”和“Beta”分组 Group Bar Chart

xl2 = xl.groupby(['Alpha','Beta']).median()

当我试着这样做的时候,一个关键的错误被抛到“Alpha”上

import seaborn as sns
sns.barplot(x=['Alpha', 'Beta'], y=xl2['Gamma'])

我希望传递一个x值列表给索引('Alpha'和'Beta'),并绘制相关的'Gamma'。seaborn.barplot function的文档没有提供任何组条形图示例。

谢谢你的帮助!


Tags: 数据alpha目标pandasseaborn关键betamedian
3条回答

这就是你想要的吗?

In [167]: df
Out[167]:
    a  b  c
0   2  2  1
1   3  3  1
2   2  2  1
3   2  3  0
4   3  2  2
5   3  3  2
6   1  2  2
7   1  2  2
8   0  2  3
9   3  2  3
10  2  2  0
11  2  1  2
12  2  1  0
13  1  2  1
14  0  2  3
15  0  3  3
16  3  1  2
17  0  1  1
18  0  2  2
19  0  1  0

In [168]: plot = df.groupby(['a','b']).mean()

In [169]: plot
Out[169]:
            c
a b
0 1  0.500000
  2  2.666667
  3  3.000000
1 2  1.666667
2 1  1.000000
  2  0.666667
  3  0.000000
3 1  2.000000
  2  2.500000
  3  1.500000

In [170]: sns.barplot(x=plot.index, y=plot.c)

PS如果您需要不同的东西,请提供一个示例数据集和预期的分组结果DF(都以text/dict/JSON/CSV格式)

enter image description here

PPS您可能还想检查this answer

你可以用ggplot来做这个

from ggplot import *
import pandas as pd
import numpy as np

df = pd.DataFrame({
    "x": np.random.choice(range(2001, 2008), 250),
    "w": np.random.uniform(50, 400, 250),
    "cat": np.random.choice(["A", "B", "C", "D", "E"], 250)
})

print ggplot(df, aes(x='x', weight='w', fill='cat')) + geom_bar() + theme_bw()

ggplot grouped bar

在这种情况下,牛郎星是有帮助的。下面是由以下代码生成的绘图。

enter image description here

进口

import pandas as pd
import numpy as np
from altair import *

生成数据集

np.random.seed(0)
df = pd.DataFrame({
    "x": np.random.choice(range(0, 5), 250),
    "w": np.random.uniform(50, 400, 250),
    "cat": np.random.choice(["A", "B", "C", "D", "E"], 250)
})

绘制

Chart(df).mark_bar().encode(x=X('cat', axis=False),  
                            y=Y('median(w)', axis=Axis(grid=False)),
                            color='cat',
                            column=Column('x', axis=Axis(axisWidth=1.0, offset=-8.0, orient='bottom'),scale=Scale(padding=30.0)),
                        ).configure_facet_cell( strokeWidth=0.0).configure_cell(width=200, height=200)

牵牛星密码的关键是:

  1. X值是类别(df中的“cat”)
  2. 颜色按类别
  3. Y值是变量的中值
  4. 不同的栏目代表不同的年份

相关问题 更多 >

    热门问题