用多索引数据帧绘制非对称误差线

> errlo = data['mean'] - data['errlo'] > errhi = data['errhi'] - data['mean'] > errlo_arr = errlo.values[:,np.newaxis,:] > errhi_arr = errhi.values[:,np.newaxis,:] > yerr = np.append(errlo_arr, errhi_arr, axis=1).T > data['mean'].plot(kind='bar', yerr=yerr)

> ix3 = pd.MultiIndex.from_arrays([['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b'], ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar']], names=['letter', 'word']) > df3 = pd.DataFrame({'data1': [3, 2, 4, 3, 2, 4, 3, 2], 'data2': [6, 5, 7, 5, 4, 5, 6, 5]}, index=ix3) > df=df3.groupby(level=['letter','word']).sum() > df.columns=['errlo','errhi'] > df['mean']=df.mean(axis='columns') > data=df.unstack(level='letter') > print data errlo errhi mean letter a b a b a b word bar 7 5 12 11 9.5 8.0 foo 5 6 11 9 8.0 7.5

1条回答

网友

1楼 · 发布于 2024-09-30 08:29:32

您可以直接使用列，并通过执行以下操作来避免numpy代码：

#assuming your initial frame
df =df3.groupby(level=['letter','word']).sum()
df.columns=['errlo','errhi']
df['mean']=df.mean(axis='columns')


df['errlo']  = df['mean'] - df['errlo']
df['errhi']  = df['errhi'] - df['mean']

data=df.unstack(level='letter')

data['mean'].plot(kind='bar', yerr=data[['errlo','errhi']].T.values)

退货：

enter image description here

相关问题更多 >

编程相关推荐

热门问题

热门文章