使用Pandas和sqlite3

+-----------------+---------+--------+ | state | D | R | +-----------------+---------+--------+ | AK | 500 | 900 | | IL | 600 | 877 | | FL | 200 | 400 | | UT | 300 | 300 | | CA | 109 | 90 | | MN | 800 | 888 |

1条回答

网友

1楼 · 发布于 2024-10-04 07:38:19

考虑使用pd作为限定符而不是数据帧的广义pandas合并，因为连接字段的名称不同，因此需要left\u on和right\u onargs。另外，如果作为数据帧的方法运行pivot_table，则不要传入df，因为调用的df被传递到函数中。你知道吗

下面将贡献者和贡献者\u与\u候选文本文件一起使用。此外，根据所需的结果，您可能希望使用pivot_table的值arg：

import numpy as np
import pandas as pd

contributors = pd.read_table('contributors_with_candidate_id.txt', sep="|")
candidates = pd.read_table('candidates.txt', sep="|")

party_and_state = pd.merge(contributors, candidates, 
                           left_on=['candidate_id'], right_on=['id'])
party_and_state.pivot_table(index=["party", "state"],
                            values=["amount"], aggfunc=np.sum)    
#                amount
# party state          
# D     CA      1660.80
#       DC       200.09
#       FL      4250.00
#       IL       200.00
#       MA       195.00
# ...
# R     AK      1210.00
#       AR     14200.00
#       AZ       120.00
#       CA     -6674.53
#       CO     -5823.00

party_and_state.pivot_table(index=["state"], columns=["party"],
                            values=["amount"], aggfunc=np.sum)
#         amount          
# party        D         R
# state                   
# AK         NaN   1210.00
# AR         NaN  14200.00
# AZ         NaN    120.00
# CA     1660.80  -6674.53
# CO         NaN  -5823.00
# CT         NaN   2300.00

注意，您可以使用read_sql在SQL中作为内部联接进行合并：

party_and_state = pd.read_sql("SELECT c.*, n.* FROM contributors c " +
                              "INNER JOIN candidates n ON c.candidate_id = n.id", 
                              con = db)

party_and_state.pivot_table(index=["state"], columns=["party"],
                            values=["amount"], aggfunc=np.sum)

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Pandas和sqlite3

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >