基于多准则的多列大Pandas计数

1条回答

网友

1楼 · 发布于 2024-09-30 20:27:41

我把台阶拆下来

df.columns=['TEXT','USER','ID']

df[word_list]=df.TEXT.str.lower().apply(lambda x : pd.Series([x.find(y) for y in word_list])).ne(-1)
df1=df[['USER','one','two','three','ID']].set_index(['USER','ID']).astype(int).replace({0:np.nan})
Target=df1.stack().reset_index().groupby('level_2').agg({'USER':lambda x : len(set(x)),'ID':lambda x : sum(set(x))})
Target=Target.reset_index()
Target.columns=['Word','Unique User Count','ID Sum']
Target
Out[97]: 
    Word  Unique User Count  ID Sum
0    one                  3     450
1  three                  1     150
2    two                  2     250

编程相关推荐

java在intellij idea中，如何将资源/文件夹编译器下的文件配置为classes/config/folder，而不是直接在classes/folder下
jdbc Java PreparedStatement保留表名大小写
java Android使用来自另一个活动的变量
如果SpringBoot中出现NoHandlerFoundException，java无法返回自定义响应
sql shell脚本未完全从java执行
java试图让视图反映编辑器的状态
数学方程中的Java操作
返回int值的java布尔方法；
java使用ANT根据包名动态生成JAR文件
带约束的java传递面板

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于多准则的多列大Pandas计数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >