两列中出现值的计数，python

import numpy as np df = np.array([['','Movie1','Movie2','Movie3'], ['User1',1,0,2], ['User2',2,4,4], ['User3',4,0,4], ['User4',0,2,4]]) print(pd.DataFrame(data=df[1:,1:], index=df[1:,0], columns=df[0,1:]))

1条回答

网友

1楼 · 发布于 2024-06-16 12:50:35

代码中有两件事

首先，通过np.array创建数据帧，基于官方文档np.array，每次只接受一种数据类型，因此numeric会自动转换为string

df.applymap(type)
Out[787]: 
              Movie1         Movie2         Movie3
User1  <class 'str'>  <class 'str'>  <class 'str'>
User2  <class 'str'>  <class 'str'>  <class 'str'>
User3  <class 'str'>  <class 'str'>  <class 'str'>
User4  <class 'str'>  <class 'str'>  <class 'str'>

解决方案

maskdf=df.ne('0')

maskdf.Movie1[maskdf.Movie2].mean()
Out[795]: 0.5

更改apply代码

df.ne('0').sum(axis=1)
Out[786]: 
User1    2
User2    3
User3    2
User4    2
dtype: int64


df.ne('0').sum()
Out[788]: 
Movie1    3
Movie2    2
Movie3    4
dtype: int64

相关问题更多 >

编程相关推荐

热门问题

热门文章

两列中出现值的计数，python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >