我一直在处理最初导出到CSV的数据,后来又从同一CSV导入到EDA中。有一个地址栏,上面附有“郊区/地区”名称。我试图找到一种方法,使用excel将这些特定的名称拆分/提取到不同的列中。但我没有得到想要的输出。如果知道我是否可以使用Python(NLTK)函数来实现这一点,会很有帮助吗
这是我的样本数据
**Address column**
4a Mcarthurs Road, Altona north
1 Neal court, Altona North
4 Vermilion Drive, Greenvale
Lot 307 Bonds Lane, Greenvale
430 Blackshaws rd, Altona North
159 Bonds lane, Greenvale
Lot 1105 4 compass Drive Greenvale
6005 Bethany dr tarneet
Lot 655 Potofino Way Wollert
lot 403 Binds Lane, Greenvale
157 Maidstone street Altona
11 Laramie Street, Greenvale
10 Preveli Way Wollert
21 Laramie Street, Greenvale
20 taipan crt tarneit
4 bisect road greenvale
83 everton road truganina
Lot 450 Vermilion Drive, Greenvale
Lot 641 Preveli Way Wollert
648 hogans rd tarneit
期望输出:
Address Suburb
4a Mcarthurs Road Altona North
1 Neal court Altona North
4 Vermilion Drive Greenvale
Lot 307 Bonds Lane Greenvale
430 Blackshaws rd Altona North
159 Bonds lane Greenvale
Lot 1105 4 compass Drive Greenvale
6005 Bethany dr Tarneet
Lot 655 Potofino Way Wollert
lot 403 Binds Lane Greenvale
157 Maidstone street Altona
11 Laramie Street Greenvale
10 Preveli Way Wollert
21 Laramie Street Greenvale
20 taipan crt Tarneit
4 bisect road Greenvale
83 everton road Truganina
Lot 450 Vermilion Drive Greenvale
Lot 641 Preveli Way Wollert
648 hogans rd Tarneit
在此方面的任何帮助都将不胜感激
提前感谢您的支持
您可以尝试以下方法:
我注意到您可以使用以下正则表达式模式将地址列拆分为地址和郊区:
输出:
注意:我相信这个正则表达式会更整洁
相关问题 更多 >
编程相关推荐