使用Pandas和sqlite3

2024-10-04 07:38:19 发布

您现在位置:Python中文网/ 问答频道 /正文

尝试实施privoteèu熊猫表,为每个政党和每个州制作一个表格,显示该政党从该州获得的捐款总额。你知道吗

这是正确的方法,还是我必须进入数据库然后离开。但是下面的代码给出了错误。你知道吗

party_and_state = candidates.merge(contributors, on='id')
party_and_state.pivot_table(df,index=["party","state"],values=["amount"],aggfunc=[np.sum])

预期结果可能与下表类似。 第一个coulmn是州名,然后党D下面的党D是每个州的总票数,同样适用于党R

+-----------------+---------+--------+
|     state       | D       | R      |
+-----------------+---------+--------+
|      AK         | 500     | 900    |
|      IL         | 600     | 877    |
|      FL         | 200     | 400    |
|      UT         | 300     | 300    |
|      CA         | 109     | 90     |
|      MN         | 800     | 888    |

Tags: and方法代码数据库onparty错误merge
1条回答
网友
1楼 · 发布于 2024-10-04 07:38:19

考虑使用pd作为限定符而不是数据帧的广义pandas合并,因为连接字段的名称不同,因此需要left\u onright\u onargs。另外,如果作为数据帧的方法运行pivot_table,则不要传入df,因为调用的df被传递到函数中。你知道吗

下面将贡献者贡献者\u与\u候选文本文件一起使用。此外,根据所需的结果,您可能希望使用pivot_tablearg:

import numpy as np
import pandas as pd

contributors = pd.read_table('contributors_with_candidate_id.txt', sep="|")
candidates = pd.read_table('candidates.txt', sep="|")

party_and_state = pd.merge(contributors, candidates, 
                           left_on=['candidate_id'], right_on=['id'])
party_and_state.pivot_table(index=["party", "state"],
                            values=["amount"], aggfunc=np.sum)    
#                amount
# party state          
# D     CA      1660.80
#       DC       200.09
#       FL      4250.00
#       IL       200.00
#       MA       195.00
# ...
# R     AK      1210.00
#       AR     14200.00
#       AZ       120.00
#       CA     -6674.53
#       CO     -5823.00

party_and_state.pivot_table(index=["state"], columns=["party"],
                            values=["amount"], aggfunc=np.sum)
#         amount          
# party        D         R
# state                   
# AK         NaN   1210.00
# AR         NaN  14200.00
# AZ         NaN    120.00
# CA     1660.80  -6674.53
# CO         NaN  -5823.00
# CT         NaN   2300.00

注意,您可以使用read_sql在SQL中作为内部联接进行合并:

party_and_state = pd.read_sql("SELECT c.*, n.* FROM contributors c " +
                              "INNER JOIN candidates n ON c.candidate_id = n.id", 
                              con = db)

party_and_state.pivot_table(index=["state"], columns=["party"],
                            values=["amount"], aggfunc=np.sum)

相关问题 更多 >