Concat 2个数据帧，54个条目，得到1个问题的回答

Concat 2个数据帧，54个条目，得到1个

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我已经创建了两个数据帧，其中有一个基于年份和地区的通用索引。每个数据帧中有58行，年份和地区是完全匹配的。然而，当我尝试加入它们时，我得到了一个新的数据帧，所有列都合并在一起（这就是我想要的），但只有一行-纽约市。这一行在两个数据帧中都存在，其余的都存在，但只有这一行进入合并的DF。我尝试了几种不同的方法来连接数据帧，但它们都做相同的事情。本例使用： <pre><code>pd.concat([ groupeddf,Popdf], axis=1) </code></pre> 这是以（年份，地区）为索引的<code>Popdf</code>： <pre><code> Population Year District 2017 Albany 309612 Allegany 46894 Broome 193639 Cattaraugus 77348 Cayuga 77603 </code></pre> 这是按年份和地区编制的<code>groupeddf</code>索引（为清楚起见，删除了一些列）： <pre><code> Total SNAP Households Total SNAP Persons \ Year District 2017 Albany 223057 416302 Allegany 36935 69802 Broome 201586 363504 Cattaraugus 75567 144572 Cayuga 64168 121988 </code></pre> 这是执行<code>pd.concat([ groupeddf,Popdf], axis=1)</code>后的合并DF： <pre><code> Population Total SNAP Households Total SNAP Persons Year District 2017 New York City 8622698 11314598 19987958 </code></pre> 这表明合并的数据帧只有一个条目： <pre><code><class 'pandas.core.frame.DataFrame'> MultiIndex: 1 entries, (2017, New York City) to (2017, New York City) Data columns (total 4 columns): Population 1 non-null int64 Total SNAP Households 1 non-null int64 Total SNAP Persons 1 non-null int64 Total SNAP Benefits 1 non-null float64 dtypes: float64(1), int64(3) memory usage: 170.0+ bytes </code></pre> 更新：我尝试了另一种方法，它证明了在我看来完全相同的索引并不是完全相同的。你知道吗 当我执行这段代码时，我得到的是重复的而不是合并： <pre><code>combined_df = groupeddf.merge(Popdf, how='outer', left_index=True, right_index=True) </code></pre> 结果如下： <pre><code>Year District 2017 Albany 223057.0 416302.0 Albany NaN NaN Allegany 36935.0 69802.0 Allegany NaN NaN Broome 201586.0 363504.0 Broome NaN NaN Cattaraugus 75567.0 144572.0 Cattaraugus NaN NaN </code></pre> 唯一的例外是你去纽约的时候。这一个不重复，所以实际上被视为同一个索引。所以数据有问题，但我不知道是什么。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

Concat 2个数据帧，54个条目，得到1个

1 个回答

相关Python问题