将每个值的频率指定给具有新列的数据帧

Index Category Frequency 0 1 1 1 3 2 2 3 2 3 4 1 4 7 3 5 7 3 6 7 3 7 8 1

Index Category Frequency 0 1 1 1 3 N.A 2 3 2 3 4 1 4 7 N.A 5 7 N.A 6 7 3 7 8 1

3条回答

网友

1楼 · 编辑于 2024-05-09 02:15:25

使用pandas.Series.map：

df['Frecuency']=df['Category'].map(df['Category'].value_counts())

或pandas.Series.replace：

df['Frecuency']=df['Category'].replace(df['Category'].value_counts())

输出：

   Index  Category  Frecuency
0      0         1          1
1      1         3          2
2      2         3          2
3      3         4          1
4      4         7          3
5      5         7          3
6      6         7          3
7      7         8          1

细节

df['Category'].value_counts()
7    3
3    2
4    1
1    1
8    1
Name: Category, dtype: int64

使用value_counts可以得到一个序列，它的index是类别的元素，values是计数。因此，可以使用map或pandas.Series.replace创建一个系列，其中category值替换为计数中的值。最后将这个序列赋给frequency列

网友

2楼 · 编辑于 2024-05-09 02:15:25

你可以像下面这样使用分组

df.groupby("Category") \
.apply(lambda g: g.assign(frequency = len(g))) \
.reset_index(level=0, drop=True)

网友

3楼 · 编辑于 2024-05-09 02:15:25

df['Frequency'] = df.groupby('Category').transform('count')

相关问题更多 >

编程相关推荐

热门问题

热门文章

将每个值的频率指定给具有新列的数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >