拆分（分解）数据帧字符串条目以分隔行。多列

test_disc['countryname'] = test_disc['countryname'].replace({'European Union': 'Austria, Belgium, Bulgaria, Croatia, Cyprus, Czechia, Denmark, Estonia, Finland, France, Germany, Greece, Hungary, Ireland,Italy, Latvia, Lithuania, Luxembourg, Malta, Netherlands,Poland, Portugal, Romania, Slovakia, Slovenia, Spain, Sweden'}) test_disc[['iso_2', 'iso_3', 'countryname', 'país afetado','year', 'SPS emergenciais', 'SPS regulares']].astype(str).apply(lambda x: x.str.split(',').explode()).reset_index()

1条回答

网友

1楼 · 发布于 2024-06-23 03:14:15

使用^{}时，应仅将目标列转换为列表内容，而不是所有列

演示数据

data = [{'iso_2': 0, 'iso_3': 'NaN', 'countryname': 'JP', 'país afetado': 'US', 'year': 2015, 'SPS emergenciais': 0, 'SPS regulares': 0}, {'iso_2': 1, 'iso_3': 'NaN', 'countryname': 'European Union', 'país afetado': 'China', 'year': 2015, 'SPS emergenciais': 0, 'SPS regulares': 0}, {'iso_2': 2, 'iso_3': 'NaN', 'countryname': 'US', 'país afetado': 'European Union', 'year': 2015, 'SPS emergenciais': 0, 'SPS regulares': 0}, {'iso_2': 3, 'iso_3': 'NaN', 'countryname': 'European Union', 'país afetado': 'European Union', 'year': 2015, 'SPS emergenciais': 0, 'SPS regulares': 0}]
df = pd.DataFrame(data)
df

       iso_2 iso_3     countryname    país afetado  year  SPS emergenciais  \
    0      0   NaN              JP              US  2015                 0   
    1      1   NaN  European Union           China  2015                 0   
    2      2   NaN              US  European Union  2015                 0   
    3      3   NaN  European Union  European Union  2015                 0   

       SPS regulares  
    0              0  
    1              0  
    2              0  
    3              0

过程：

for col in ['país afetado', 'countryname']:
    df[col] = df[col].replace({'European Union': 'Austria, Belgium, Netherlands,Poland'})
    df[col] = df[col].str.split(',\s*')

df_result = df.explode('countryname').explode('país afetado')

结果:

   iso_2 iso_3  countryname país afetado  year  SPS emergenciais  
0      0   NaN           JP           US  2015                 0   
1      1   NaN      Austria        China  2015                 0   
1      1   NaN      Belgium        China  2015                 0   
1      1   NaN  Netherlands        China  2015                 0   
1      1   NaN       Poland        China  2015                 0   
2      2   NaN           US      Austria  2015                 0   
2      2   NaN           US      Belgium  2015                 0   
2      2   NaN           US  Netherlands  2015                 0   
2      2   NaN           US       Poland  2015                 0   
3      3   NaN      Austria      Austria  2015                 0   
3      3   NaN      Austria      Belgium  2015                 0   
3      3   NaN      Austria  Netherlands  2015                 0   
3      3   NaN      Austria       Poland  2015                 0   
3      3   NaN      Belgium      Austria  2015                 0   
3      3   NaN      Belgium      Belgium  2015                 0   
3      3   NaN      Belgium  Netherlands  2015                 0   
3      3   NaN      Belgium       Poland  2015                 0   
3      3   NaN  Netherlands      Austria  2015                 0   
3      3   NaN  Netherlands      Belgium  2015                 0   
3      3   NaN  Netherlands  Netherlands  2015                 0   
3      3   NaN  Netherlands       Poland  2015                 0   
3      3   NaN       Poland      Austria  2015                 0   
3      3   NaN       Poland      Belgium  2015                 0   
3      3   NaN       Poland  Netherlands  2015                 0   
3      3   NaN       Poland       Poland  2015                 0

相关问题更多 >

编程相关推荐

热门问题

热门文章