如何根据另一列中的值是否包含在另一个datafram的特定列中来设置一个dataframe的列值

2024-06-25 23:39:24 发布

您现在位置:Python中文网/ 问答频道 /正文

如何根据数据帧的另一列中的值是否包含在另一个数据帧的特定列中来设置数据帧的一列的值。如果包含,则数字为1,否则为0。例如:我有两个数据帧:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 


TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

我想检查a的'age'列中的每个数字是否都包含在TableB的'age'列中,如果包含,请在a中添加一列'Observer',并将值设置为1,如果不包含,则为0

I have tried this:

a['age'].isin(TableB['age'].set_value('Observer',1)

预期结果如下,但我的结果是a的observer列中的所有值都是1

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6],'observer':[1,1,1,0,0,0]}

Tags: 数据nonamefalsetrueage数字observer
2条回答
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 
a = pd.DataFrame(a)
print (a)
   age  no
0   22   1
1   38   2
2   26   3
3   62   4
4  198   5
5   27   6

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

TableB = pd.DataFrame(TableB)
print (TableB)
        name  age   fare  survived?
0     Braund   22   7.25      False
1   Cummings   38  71.83       True
2  Heikkinen   26   0.00       True
3      Allen   35   8.05      False
4       Mary   41   7.00       True
5     Celina   22   6.05      False
6      Roger   38   6.00       True

您可以将布尔掩码强制转换为整数,用于True/False1/0映射:

a['observer'] = a['age'].isin(TableB['age']).astype(int)

另一种解决方案是使用^{}

a['observer'] = np.where(a['age'].isin(TableB['age']), 1, 0)
print (a)
   age  no  observer
0   22   1         1
1   38   2         1
2   26   3         1
3   62   4         0
4  198   5         0
5   27   6         0

如果使用字典,则使用列表理解和if-else并通过in测试成员资格:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}


a['observer'] = [1 if x in TableB['age'] else 0 for x in a['age']]
print (a)
{'age': [22, 38, 26, 62, 198, 27], 'no': [1, 2, 3, 4, 5, 6], 'observer': [1, 1, 1, 0, 0, 0]}
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}
 a['observer']=[];

for i in a['age']:
  if i in  TableB['age'] :
     a['observer'].append(1)
  else :
      a['observer'].append(0)

相关问题 更多 >