我正在写一篇经济学论文,需要一些帮助来组合和转换两个数据集。在
我有两个pandas数据帧,一个包含国家及其邻国(borderdf)的列表,例如
borderdf
country neighbor
sweden norway
sweden denmark
denmark germany
denmark sweden
一个是每个国家和年份的数据(datadf),例如
^{pr2}$我需要在datadf中为neighbormeangdp创建一个列,该列包含所有邻居的gdp平均值,如neighbordf所示。我希望我的结果是这样的:
datadf
country year gdp neighborsmeangdp
sweden 2004 5454 5565
sweden 2005 5676 5775
我该怎么做?在
您可以使用pandas
merge
函数直接合并这两者。 这里的诀窍是,您实际上想要将datadf
中的国家列与您的borderdf
中的邻居列合并。 然后使用groupby
和mean
得到平均邻近gdp。 最后,与数据合并,得到该国的国内生产总值。 例如:我认为一个直接的方法是把GDP值放进
border
DataFrame
。那么{cd5>要做什么呢当然,我得为德国编些数据
^{pr2}$我敢肯定事实上她做得更好。在
相关问题 更多 >
编程相关推荐