添加一个“rest”组

2024-10-03 02:41:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我刚开始和熊猫图书馆合作分析大数据集。我正在分析具有issuercountrycode属性的信用卡数据,该属性由117种可能性组成。当试图可视化我的数据集中使用的issuercountrycode时,我当前使用以下代码生成一个piechart。你知道吗

df['issuercountrycode'].value_counts().plot(kind='pie')
plt.show()

这将导致以下图表:

Example of my piechart

如您所见,这并不理想,因为不经常使用多个值。在使用value\u counts()函数时,是否有可能添加一个阈值,并将低于某个值的值添加到“rest”组中?这些类型的操作在熊猫身上是可能的吗?你知道吗


Tags: 数据df属性图书馆plotvalue可视化可能性
1条回答
网友
1楼 · 发布于 2024-10-03 02:41:47

你需要用^{}sum来计算它:

tresh = 2
a = df['issuercountrycode'].value_counts()
b = a[a > tresh]
b['rest'] = a[a <= tresh].sum()

样品:

np.random.seed(10)
L = list('abcdef')
df = pd.DataFrame({'issuercountrycode':np.random.choice(L, size=15)})

tresh = 2
a = df['issuercountrycode'].value_counts()
b = a[a > tresh]
b['rest'] = a[a <= tresh].sum()
print (b)
b       5
f       3
a       3
rest    4
Name: issuercountrycode, dtype: int64

b.plot.pie()

graph

相关问题 更多 >