SQL值更新pandas数据帧

sets3 = [] i=0 for accountno in df5['kna1_kunnr']: df1 = pd.read_sql(('select sum(VBRK_NETWR) as sum from sapdata2016.orders where VBAK_BSARK="ZEDI" and VBRK_KUNAG = %s;') % accountno, conn) df2 = pd.DataFrame([(df5['userid'][i], df5['kna1_kunnr'][i], accountno, df5['kna1_name1'][i], df1['sum'][0])], columns=['User ID', 'AccountNo', 'tjeck', 'AccountName', 'Revenue']) sets3.append(df2) i += 1 df6 = pd.concat(sets3)

1条回答

网友

1楼 · 发布于 2024-06-28 14:33:04

考虑将pandas数据作为临时表导出到MySQL，然后运行一个连接pandas数据的SQL查询和TotalRevenue的聚合查询。然后，将resultset读入pandas dataframe。这种方法避免了任何循环。在

from sqlalchemy import create_engine
...

# SQL ALCHEMY CONNECTION (PREFERRED OVER RAW CONNECTION)
engine = create_engine('mysql://user:pwd@localhost/database')
# engine = create_engine("mysql+pymysql://user:pwd@hostname:port/database") # load pymysql

df1.to_sql("mypandastemptable", con=engine, if_exists='replace')

sql = """SELECT t.UserID, t.AccountNo, t.AccountName, agg.TotalRevenue
         FROM mypandastemptable t
         LEFT JOIN 
            (SELECT VBRK_KUNAG as AccountNo
                    SUM(VBRK_NETWR) as TotalRevenue
             FROM sapdata2016.orders 
             WHERE VBAK_BSARK='ZEDI'
             GROUP BY VBRK_KUNAG) agg
         ON t.AccountNo = agg.AccountNo) 
"""

newdf = pd.read_sql(sql, con=engine)

当然反之亦然，合并现有数据帧的两个pandas数据帧和分组聚合查询结果集：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章