我有关键词
India
Japan
United States
Germany
China
下面是示例数据帧
id Address
1 Chome-2-8 Shibakoen, Minato, Tokyo 105-0011, Japan
2 Arcisstraße 21, 80333 München, Germany
3 Liberty Street, Manhattan, New York, United States
4 30 Shuangqing Rd, Haidian Qu, Beijing Shi, China
5 Vaishnavi Summit,80feet Road,3rd Block,Bangalore, Karnataka, India
我的目标是
id Address India Japan United States Germany China
1 Chome-2-8 Shibakoen, Minato, Tokyo 105-0011, Japan 0 1 0 0 0
2 Arcisstraße 21, 80333 München, Germany 0 0 0 1 0
3 Liberty Street, Manhattan, New York, USA 0 0 1 0 0
4 30 Shuangqing Rd, Haidian Qu, Beijing Shi, China 0 0 0 0 1
5 Vaishnavi Summit,80feet Road,Bangalore, Karnataka, India 1 0 0 0 0
基本思想是创建关键字检测器,我想使用str.contain
和word2vec
,但我不能得到逻辑
利用
pd.get_dummies()
:另外,最直接的方法是将国家列在一个列表中,并使用for循环
但如果你有大量的数据和国家,这可能会很慢。你知道吗
注意:如果country不在
Address
列的最后一个位置,或者country name包含,
,则此方法不起作用相关问题 更多 >
编程相关推荐