我正在用BS4来抓取房产广告,用pandas分析数据。在
在我的数据框中,行表示物业广告,列表示物业特征,如租金、面积、地区等
在一些楼盘广告中,区名拼写错误,甚至完全缺失。我想删除那些物业广告,即我想删除拼写错误或缺少区名的行。
我有一份包含正确地区名称的名单
correct_districts=['North', 'South', 'West', 'East']
我有一个数据帧city_df
,它有一个地区列,例如
检查this answer的条件行选择,我这样做了
city_df=city_df.loc[~city_df['District'].isin(correct_districts)]
但是,这不会改变District
列中的任何内容。如果删除~
并执行命令,则只剩下缺少地区名称的行。在
我应该做些什么来删除区名丢失或拼写错误的行?在
目前没有回答
相关问题 更多 >
编程相关推荐