我用这个来做假人
train = pd.get_dummies(train, columns=['LSOA code','Last outcome category','Month'])
但我只想得到那些值重复超过1000次的假人
样本DF:
id col1
1 aaa
2 aaa
3 aaa
4 bbb
5 bbb
6 ccc
使用此代码的当前输出:df= pd.get_dummies(df, columns=['col1'])
id aaa bbb ccc
1 1 0 0
2 1 0 0
3 1 0 0
4 0 1 0
5 0 1 0
6 0 0 0
我想要的是:只得到那些重复多次的值的假人
id aaa bbb
1 1 0
2 1 0
3 1 0
4 0 1
5 0 1
6 0 0
尝试使用^{} 和逻辑条件
> 1000
创建“有效”类别的列表然后调用^{} 类型上的^{} ,并将此有效
categories
列表作为参数传递:使用您的示例
[外]
相关问题 更多 >
编程相关推荐