如何根据从另一个数据集中匹配的唯一值从数据集中删除行？

for col in data.columns: if data[col].dtype == "object": print(col) print(data[col].unique()) print('') Frequency ['Monthly' 'Quatrly' 'Half Yearly' 'BI-Monthly'] PaymentMode ['PDC_E' 'PDC' 'Direct Debit' 'Billed' 'ECS' 'Auto Debit' 'SI Reject' 'ECS Reject' 'Cheque' 'PDC Reject' 'Escrow'] for col in valData.columns: if valData[col].dtype == "object": print(col) print(valData[col].unique()) print('') Frequency ['Monthly' 'Quatrly' 'Half Yearly'] PaymentMode ['PDC_E' 'PDC' 'Billed' 'Direct Debit' 'ECS' 'ECS Reject' 'SI Reject' 'Cheque' 'Auto Debit' 'PDC Reject']

1条回答

网友

1楼 · 发布于 2024-09-28 03:13:32

在这种情况下不能使用多列。两个过滤器的组合，要求两个列没有测试中不存在的因素，应该可以工作：

data = pd.DataFrame({'Frequency':np.random.choice(['Monthly','Quatrly','Half Yearly','BI-Monthly'],100),
'PaymentMode':np.random.choice(['Cheque','PDC Reject','Escrow'],100)})

valData = pd.DataFrame({'Frequency':np.random.choice(['Monthly','Quatrly','Half Yearly'],100),
'PaymentMode':np.random.choice(['Cheque','PDC Reject',],100)})

da = data[(data["Frequency"].isin(valData["Frequency"]) & data["PaymentMode"].isin(valData["PaymentMode"]))]

pd.crosstab(da['Frequency'],da['PaymentMode'])
Out[25]: 
PaymentMode  Cheque  PDC Reject
Frequency                      
Half Yearly       9           5
Monthly           9          11
Quatrly           7           6

相关问题更多 >

编程相关推荐

热门问题

热门文章