为什么我在海上出生的拍档要花很长时间来策划

2024-10-02 22:31:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个由274,170 rows and 15 columns组成的Pandas DataFrame。他们都是numerical columns。我对使用Seaborn's Pairplot来查看他们的distribution and correlation感兴趣。在15列中,我希望看到这9列

以下是我的尝试:

    plt.figure(figsize=(20,15))
    g = sns.pairplot(df, 
                     palette="husl",
                     vars=["age", "amount", "dir", "type",
                           "reg", "per", "reason",
                           "deal", "policy", "request"])

这需要永远!请问是什么问题。我可以做些什么来使用Seaborn Pairplot,因为这是我期待的Data visualization类型,以便正确理解我的数据

谢谢


Tags: columnsanddataframepandaspltnumericalseaborn感兴趣
1条回答
网友
1楼 · 发布于 2024-10-02 22:31:09

一个seaborn pairplot需要大量的资源,尤其是有大量的列和行。对于大量行,我建议绘制一部分数据(帧),以获得数据的良好指示

n = 274_170
frac = 0.10
df = pd.DataFrame(np.random.rand(n, 10),
                  columns = ["age", "amount", "dir", "type", "reg", "per", "reason", "deal", "policy", "request"])
plt.figure(figsize=(20,15))
sns.pairplot(df.sample(frac=frac), palette="husl", vars=["age", "amount", "dir", "type", "reg", "per", "reason", "deal", "policy", "request"])
plt.show()

相关问题 更多 >