将dataframe total追加到新datafram

df = pd.read_sql("select count(*) as requests,\ filename,\ file_extension,\ date_trunc('day', log_time) as date\ from "+dbase+"\ where\ filename like '%anyStringA%'\ OR\ filename like '%anyStringB%'\ OR\ filename like '%anyStringC%'\ and\ file_extension not in ('gif')\ group by filename,file_extension,date_trunc('day', log_time)\ order by requests desc",conn)

requests filename Extension date 0 10 xxanyStringAxx .jpg 2018-10-31 1 8 xxanyStringBxx .jpg 2018-10-31 2 11 xxanyStringCxx .jpg 2018-10-31 3 12 xxxanyStringAxx .jpg 2018-10-31 .

1条回答

网友

1楼 · 发布于 2024-10-02 20:31:12

IIUC，您希望从文件名中提取Album后面和下划线_前面的字符串，然后按该字符串分组，获取总和，并将其放入新表中。如果是这种情况，您可以这样做（我添加了一些任意相册来说明）：

>>> df
   Requests    filename Extension        date
0    914208  AlbumA_100      .jpg  2018-10-31
1     73795  AlbumA_132      .jpg  2018-10-31
2     39651  AlbumA_130      .jpg  2018-10-31
3        10  AlbumB_130      .jpg  2018-10-31
4        15  AlbumB_135      .jpg  2018-10-31
4        85  AlbumC_135      .jpg  2018-10-31
4        15   AlbumC_13      .jpg  2018-10-31

totals_df = (df.groupby(df.filename.str.extract('Album(.*)_'))
             .Requests.sum()
             .add_prefix('Total_')
             .to_frame())

>>> totals_df
          Requests
filename          
Total_A    1027654
Total_B         25
Total_C        100

相关问题更多 >

编程相关推荐

热门问题

热门文章