在datafram中按不同的列分组后，我们应该如何计算列中的值之和

available_days=listings.groupby(['availability_365']).count() available_days=listings.groupby(['availability_365'])['reviews_count'].count() available_days=listings.groupby('availability_365').agg('sum') available_days=listings.groupby(['availability_365']).agg({'reviews_count':np.sum})

1条回答

网友

1楼 · 发布于 2024-05-02 21:41:11

你是说这样的事吗

import pandas as pd

df = pd.DataFrame({
    "availability": [1, 2, 2, 3, 3, 3, 4, 4, 4, 4],
    "num_reviews": [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
})

# Count number of reviews per unique value for "availibility"
df["reviews_by_availability"] = df.groupby("availability")["num_reviews"].transform("sum")
print df

# Optionally, print only one instance of each "availability"
print df.drop_duplicates(subset=["availability"])

输出：

   availability  num_reviews  reviews_by_availability
0             1            1                        1
1             2            1                        2
2             2            1                        2
3             3            1                        3
4             3            1                        3
5             3            1                        3
6             4            1                        4
7             4            1                        4
8             4            1                        4
9             4            1                        4
   availability  num_reviews  reviews_by_availability
0             1            1                        1
1             2            1                        2
3             3            1                        3
6             4            1                        4

另外，请不要张贴您的数据图像，这是没有帮助的

编辑：您可以用pandas.DataFrame.plot.scatter()绘制它：

# Draw scatterplot
import matplotlib.pyplot as plt
df.drop_duplicates(subset=["availability"]).plot.scatter(x="availability", y="reviews_by_availability")
plt.show()

结果：

相关问题更多 >

编程相关推荐

热门问题

热门文章

在datafram中按不同的列分组后，我们应该如何计算列中的值之和

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >