我希望检查一个数据帧列中的类别是否与另一个数据帧列中的类别匹配,即拼写等方面是否不匹配
我现在有两个数组,表示感兴趣的列中的所有唯一值,我想返回第一个较小数组中的任何值,但不在第二个较大数组中的任何值,因此,我可以缩小可能需要调整/重新拼写等的类别。我认为我应该使用for循环来评估每个数组,但我正在努力实现。下面的示例代码,谢谢:
borough_pm25 = pm25['Borough_x'].unique()
borough_pm25
array(['Barnet', 'Camden', 'Wandsworth', 'Hounslow', 'Southwark',
'Westminster', 'Kensington & Chelsea', 'Tower Hamlets',
'Islington', 'Kingston', 'Barking & Dagenham', 'Waltham Forest',
'Haringey', 'Lambeth', 'Enfield', 'Greenwich', 'Redbridge',
'Newham', 'City of London', 'Hackney', 'Richmond', 'Ealing',
'Hammersmith & Fulham', 'Lewisham', 'Sutton', 'Havering', 'Bexley',
'Bromley'], dtype=object)
borough_map = map_df['NAME'].unique()
borough_map
array(['Kingston upon Thames', 'Croydon', 'Bromley', 'Hounslow', 'Ealing',
'Havering', 'Hillingdon', 'Harrow', 'Brent', 'Barnet', 'Lambeth',
'Southwark', 'Lewisham', 'Greenwich', 'Bexley', 'Enfield',
'Waltham Forest', 'Redbridge', 'Sutton', 'Richmond upon Thames',
'Merton', 'Wandsworth', 'Hammersmith and Fulham',
'Kensington and Chelsea', 'Westminster', 'Camden', 'Tower Hamlets',
'Islington', 'Hackney', 'Haringey', 'Newham',
'Barking and Dagenham', 'City of London'], dtype=object)
您可以使用
set
操作相关问题 更多 >
编程相关推荐