如何从多个列中提取重复值?

2024-10-02 16:32:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个关于大市场销售的数据集。 (你可以在这里找到) https://www.kaggle.com/brijbhushannanda1979/bigmart-sales-data

数据集中有“Outlet\u Location\u Type”和“Outlet\u Size”等列。 我想找出有多少第1层的位置有中等'出口大小',并想可视化这使用分组条形图。我需要一个pythonic解决方案。 感谢您的帮助


Tags: 数据httpscomdatasize市场可视化www
1条回答
网友
1楼 · 发布于 2024-10-02 16:32:53

您需要使用groupby方法:

df = pd.read_csv('Test.csv')
df = df[df['Outlet_Location_Type']=='Tier 1'].groupby(['Outlet_Size']).count()

每列相等并包含元素数,因此您可以随机选择一列来绘制计数:

df['Item_Identifier'].plot(kind='bar', stacked=True)
plt.show()

相关问题 更多 >