如何在python-pandas-datafram中计算复合度量

d = [{'city':'new-york', 'code':1111, 'recv':1977.44, 'send':0.0}, {'city':'new-york', 'code':2222, 'recv':6758926663.7439995, 'send':0.0}, {'city':'new-york', 'code':3333, 'recv':189769.38666666666, 'send':0.0}, {'city':'amsterdam', 'code':4444, 'recv':2356311.024, 'send':263030.0906666667}, {'city':'amsterdam', 'code':5555, 'recv':959.968, 'send':8.063999999999998}]

In [52]: ixmac.query('city==["new-york"] & code==[1111]').loc[:,['recv']] Out[52]: recv city code new-york 1111 1977.44 D = ixmac.query('city==["new-york"]').sum().loc['recv']

recv send ratio_asn ratio_recv city code amsterdam 4444 2.356311e+06 263030.090667 0.4 =2/5 0.00034849062450182164 =2.356311e+06/2.356311e+06 5555 9.599680e+02 8.064000 0.4 =2/5 1.4197610070222678e-07 =9.599680e+02/2.356311e+06 new-york 1111 1.977440e+03 0.000000 0.6 =3/5 2.9245685332491435e-07 =1.977440e+03/2.356311e+06 2222 6.758927e+09 0.000000 0.6 =3/5 0.9996230086742471 =6.758927e+09/2.356311e+06 3333 1.897694e+05 0.000000 0.6 =3/5 2.8066268297069442e-05 =1.897694e+05/2.356311e+06 In [8]: total = 2.356311e+06 + 9.599680e+02 + 1.977440e+03 + 6.758927e+09 +1.897694e+05 In [9]: total Out[9]: 2.356311e+06

1条回答

网友

1楼 · 发布于 2024-09-30 06:22:28

你可以这样做：

In [105]: g = df.groupby('city')

In [106]: df['ratio_asn'] = g.recv.transform(lambda x: len(x)/len(df))

In [107]: df['ratio_recv'] = g.recv.transform(lambda x: x/df.recv.sum())

In [108]: df
Out[108]:
        city  code          recv           send  ratio_asn    ratio_recv
0   new-york  1111  1.977440e+03       0.000000        0.6  2.924569e-07
1   new-york  2222  6.758927e+09       0.000000        0.6  9.996230e-01
2   new-york  3333  1.897694e+05       0.000000        0.6  2.806627e-05
3  amsterdam  4444  2.356311e+06  263030.090667        0.4  3.484906e-04
4  amsterdam  5555  9.599680e+02       8.064000        0.4  1.419761e-07

相关问题更多 >

编程相关推荐

热门问题

热门文章