当总数不是100%时，如何计算百分比？

sns.set(font_scale=1.4) ax = listsocial.plot(kind='bar', figsize=(15,7), color=('#009C3B'), grid=True) ax.yaxis.set_major_formatter(mtick.PercentFormatter(decimals=False)) plt.xticks(rotation=80) plt.suptitle('Most used social networks', fontsize=20) plt.xlabel('Social network', fontsize=14, labelpad=20) plt.ylabel('Respondents\n(%)', fontsize=14, labelpad=20) plt.show()

2条回答

网友

1楼 · 编辑于 2024-10-01 07:17:59

您可以除以行数，而不是调用value_counts(normalize=True)：

from matplotlib import pyplot as plt
from matplotlib import ticker as mtick
import numpy as np
import pandas as pd
import seaborn as sns

networks = np.array(['facebook', 'twitter', 'instagram', 'other'])
socnetw = [", ".join(networks[np.random.randint(0, 2, 4, dtype=bool)]) for _ in range(100)]
df = pd.DataFrame({"SocialNetworks": socnetw})

listsocial = df["SocialNetworks"].str.split(', ', expand=True)
listsocial = 100 * listsocial.stack().value_counts() / len(listsocial)
listsocial = listsocial.iloc[:-1] # remove the last row (which contains the count for 'None')

sns.set(font_scale=1.4)

ax = listsocial.plot(kind='bar', figsize=(15, 7), color=('#009C3B'), grid=True)
ax.yaxis.set_major_formatter(mtick.PercentFormatter(decimals=False))
plt.xticks(rotation=80)
plt.suptitle('Most used social networks', fontsize=20)
plt.xlabel('Social network', fontsize=14, labelpad=20)
plt.ylabel('Respondents (%)', fontsize=14, labelpad=20)
plt.tight_layout()
plt.show()

网友

2楼 · 编辑于 2024-10-01 07:17:59

在这种情况下，拆分和堆叠不是办法

我会为每个感兴趣的社交网络创建单独的列，并分配True，如果它包含在字符串中（类似于一个热编码器）

social_networks = pd.DataFrame()
for sn in ['Facebook', 'Twitter', ...]:
    social_networks[sn] = df['SocialNetworks'].str.contains(sn)

然后你就可以用

social_networks = social_networks.mean()

相关问题更多 >

编程相关推荐

热门问题

热门文章