我有两个数据帧, 这是输入csv数据
Document_ID OFFSET PredictedFeature
0 0 2000
0 8 2000
0 16 2200
0 23 2200
0 30 2200
1 0 2100
1 5 2100
1 7 2100
现在我也有了输出数据
Document_ID OFFSET PredictedFeature
0 0 2000
0 8 2100
0 16 2100
0 23 2100
0 30 2200
1 0 2000
1 5 2000
1 7 2100
现在,我要做的是,匹配他们得到的结果
所以我做了
df1_inputPredictedFeature_column['new'] = df1_inputPredictedFeature_column['PredictedFeature'] == df1_predictedFeature_column['PredictedFeature']
这将添加一个列,告诉您它是否与predictedfeature列匹配
现在我要做的是
共有2个功能,其中2000在输入csv的predictedfeature中。但在输出csv中,只有第一位匹配,而不是第二位
所以我想得到这样的数据
predictedFeatureClass inputCsvOccured outputcsvmatched
2000 2 1
2200 3 1
那么,我怎样才能得到这些数据呢?任何帮助都会很好
一种想法是通过^{} 将
new
列转换为整数,然后通过指定新列名称的元组列表将new
列与size
和sum
聚合:0.25+溶液:
你可以像下面这样使用groupby
结果
相关问题 更多 >
编程相关推荐