Pareto是Excel和Tableu中非常流行的诊断工具。在excel中,我们可以很容易地画出一个Pareto图,但是我发现用Python来画这个图并不容易。
我有一个这样的熊猫数据框:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
df = pd.DataFrame({'country': [177.0, 7.0, 4.0, 2.0, 2.0, 1.0, 1.0, 1.0]})
df.index = ['USA', 'Canada', 'Russia', 'UK', 'Belgium', 'Mexico', 'Germany', 'Denmark']
print(df)
country
USA 177.0
Canada 7.0
Russia 4.0
UK 2.0
Belgium 2.0
Mexico 1.0
Germany 1.0
Denmark 1.0
如何绘制帕累托图? 也许用熊猫,海伯恩,matplotlib等?
到目前为止,我已经能够制作降序条形图。 但仍需将累积和线图放在其上。
我的尝试:
df.sort_values(by='country',ascending=False).plot.bar()
您可能希望创建一个包含百分比的新列,并将一列绘制为条形图,另一列绘制为双轴折线图。
ImportanceOfBeingErnest代码的更通用版本:
这一个也包括按阈值分组的Pareto。 例如:如果将其设置为70,则它会将70岁以上的少数民族分组为一个称为“其他”的组。
相关问题 更多 >
编程相关推荐