混合/组合两个半完整数据帧

| Country | 2014 | 2015 | 2016 | 2017 | 2018 | |--------:|------|------|------|------|------| | USA | nan | nan | 323 | 325 | 328 | | UK | nan | nan | nan | 63 | 65 | | India | nan | nan | 800 | nan | 1100 | | China | nan | nan | 1100 | 1200 | 1300 |

| Country | 2014 | 2015 | 2016 | 2017 | 2019 | |--------:|------|------|------|------|------| | USA | 319 | 321 | 324 | nan | 330 | | UK | 58 | 60 | nan | nan | 68 | | India | 780 | 810 | 820 | nan | 1300 | | Nigeria | 90 | 100 | 105 | nan | 110 |

| Country | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | |--------:|------|------|------|------|------|------| | USA | 319 | 321 | 323 | 325 | 328 | 330 | | UK | 58 | 60 | nan | 63 | 65 | 68 | | India | 780 | 810 | 820 | nan | 1100 | 1300 | | China | nan | nan | 1100 | 1200 | 1300 | nan | | Nigeria | 90 | 100 | 105 | nan | nan | 110 |

3条回答

网友

1楼 · 编辑于 2024-09-28 17:27:17

您可以使用concat和groupby：

(pd.concat([df1,df2], sort=False)
   .groupby('Country', sort=False,as_index=False)
   .agg('first')
)

输出：

   Country   2014   2015    2016    2017    2018    2019
0      USA  319.0  321.0   323.0   325.0   328.0   330.0
1       UK   58.0   60.0     NaN    63.0    65.0    68.0
2    India  780.0  810.0   800.0     NaN  1100.0  1300.0
3    China    NaN    NaN  1100.0  1200.0  1300.0     NaN
4  Nigeria   90.0  100.0   105.0     NaN     NaN   110.0

网友

2楼 · 编辑于 2024-09-28 17:27:17

你可以做：

result = pd.concat([A.melt(id_vars='Country', var_name='Year', value_name='Population'),
                    B.melt(id_vars='Country', var_name='Year', value_name='Population')]).dropna()

print(pd.crosstab(index=result.Country, columns=result.Year, values=result.Population, aggfunc='mean'))

输出

Year      2014   2015    2016    2017    2018    2019
Country                                              
China      NaN    NaN  1100.0  1200.0  1300.0     NaN
India    780.0  810.0   810.0     NaN  1100.0  1300.0
Nigeria   90.0  100.0   105.0     NaN     NaN   110.0
UK        58.0   60.0     NaN    63.0    65.0    68.0
USA      319.0  321.0   323.5   325.0   328.0   330.0

网友

3楼 · 编辑于 2024-09-28 17:27:17

用途：

df_join=( df2.merge(df1,how='outer')
           .groupby('Country')
           .apply(lambda x: x.ffill().bfill())
           .drop_duplicates('Country') )
print(df_join)

   Country   2014   2015    2016    2017    2019    2018
0      USA  319.0  321.0   324.0   325.0   330.0   328.0
1       UK   58.0   60.0     NaN    63.0    68.0    65.0
2    India  780.0  810.0   820.0     NaN  1300.0  1100.0
3  Nigeria   90.0  100.0   105.0     NaN   110.0     NaN
7    China    NaN    NaN  1100.0  1200.0     NaN  1300.0

相关问题更多 >

编程相关推荐

热门问题

热门文章