回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有两个数据集:</p>
<ol>
<li>数据集<strong>A</strong>代表一个球队的球员在特定年份拥有的球迷数量</li>
<li>数据集<strong>B</strong>表示一个团队在特定游戏中获胜的次数</li>
</ol>
<p>我现在想结合这两个数据框架,并每年为每个团队汇总数据</p>
<pre><code>a = pd.DataFrame({
'year': [1995, 1995, 1995, 1995, 1996, 1996, 1996, 1996],
'team': ['Panthers', 'Panthers', 'Eagles', 'Eagles', 'Panthers', 'Panthers', 'Eagles', 'Eagles'],
'name': ['Joe', 'Betty', 'James', 'Sandra', 'Tyrone', 'Betty', 'James', 'Michael'],
'fans': [100, 200, 244, 277, 800, 900, 122, 300]
})
b = pd.DataFrame({
'year': [1995, 1995, 1995, 1995, 1996, 1996, 1996, 1996],
'team': ['Panthers', 'Panthers', 'Eagles', 'Eagles', 'Panthers', 'Panthers', 'Eagles', 'Eagles'],
'wins': [4, 2, 3, 5, 6, 7, 2, 4]
})
aa = a.groupby(['year', 'team']).sum()
bb = b.groupby(['year', 'team']).sum()
aa.join(bb)
</code></pre>
<p>这是可行的,但似乎有一些列的问题。最后的操作<code>aa.join(bb).columns</code>只产生<code>['fans', 'wins']</code>。我猜这是一个不完整的<code>groupby</code>操作的遗留问题</p>
<p>为了更好地了解数据,可以使用nbviewer<a href="http://nbviewer.ipython.org/urls/gist.githubusercontent.com/bodokaiser/fad68c0965fc6e563434/raw/8fc86dcc40e34406d3b1be45200c84fbdb7d39a8/join.ipynb" rel="nofollow">here</a>查看数据</p>
<p><strong>如何正确地进行分组并将这两个帧连接起来?</strong></p>