尝试实施privoteèu熊猫表,为每个政党和每个州制作一个表格,显示该政党从该州获得的捐款总额。你知道吗
这是正确的方法,还是我必须进入数据库然后离开。但是下面的代码给出了错误。你知道吗
party_and_state = candidates.merge(contributors, on='id')
party_and_state.pivot_table(df,index=["party","state"],values=["amount"],aggfunc=[np.sum])
预期结果可能与下表类似。 第一个coulmn是州名,然后党D下面的党D是每个州的总票数,同样适用于党R
+-----------------+---------+--------+
| state | D | R |
+-----------------+---------+--------+
| AK | 500 | 900 |
| IL | 600 | 877 |
| FL | 200 | 400 |
| UT | 300 | 300 |
| CA | 109 | 90 |
| MN | 800 | 888 |
考虑使用
pd
作为限定符而不是数据帧的广义pandas合并,因为连接字段的名称不同,因此需要left\u on和right\u onargs。另外,如果作为数据帧的方法运行pivot_table
,则不要传入df
,因为调用的df被传递到函数中。你知道吗下面将贡献者和贡献者\u与\u候选文本文件一起使用。此外,根据所需的结果,您可能希望使用pivot_table的值arg:
注意,您可以使用read_sql在SQL中作为内部联接进行合并:
相关问题 更多 >
编程相关推荐