收集通过随机抽样其他数据帧构建的数据帧的摘要统计信息

dfposlist = [OFdf, Firstdf, Seconddf, Thirddf, CFdf, RFdf, Cdf, SSdf] OFdf.head() playerID OPW POS salary 87 bondsba01 62.061290 OF 8541667 785 ramirma02 35.785630 OF 13050000 966 walkela01 30.644305 OF 6050000 859 sheffga01 29.090699 OF 9916667 357 gilesbr02 28.160054 OF 7666666

teamdist = [] for df in dfposlist: frames = [df.sample(n=1)] team = pd.concat(frames) teamopw = team['OPW'].sum() teamsal = team['salary'].sum() teamplayers = team['playerID'].tolist() teamdic = {'Salary':teamsal, 'OPW':teamopw, 'Players':teamplayers} teamdist.append(teamdic)

teamdist = [] team = pd.concat([df.sample(n=1) for df in dfposlist]) teamopw = team[['OPW']].values.sum() teamsal = team[['salary']].values.sum() teamplayers = team['playerID'].tolist() teamdic = {'Salary':teamsal, 'OPW':teamopw, 'Players':teamplayers} teamdist.append(teamdic)

1条回答

网友

1楼 · 发布于 2024-10-04 07:33:37

此处（随机数据）：

import pandas as pd
import numpy as np

dfposlist = dict(zip(range(10),
                     [pd.DataFrame(np.random.randn(10, 5),
                                   columns=list('abcde'))
                     for i in range(10)]))
for df in dfposlist.values():
    df['f'] = list('qrstuvwxyz')

teamdist = []
team = pd.concat([df.sample(n=1) for df in dfposlist.values()])
print(team.info())

teamdic = team[['a', 'c', 'e']].sum().to_dict()
teamdic['f'] = team['f'].tolist()
teamdist.append(teamdic)
print(teamdist)

# Output:
## team.info():
<class 'pandas.core.frame.DataFrame'>
Int64Index: 10 entries, 1 to 6
Data columns (total 6 columns):
a    10 non-null float64
b    10 non-null float64
c    10 non-null float64
d    10 non-null float64
e    10 non-null float64
f    10 non-null object
dtypes: float64(5), object(1)
memory usage: 560.0+ bytes
None

## teamdist:
[{'a': -3.5380097363724601,
  'c': 2.0951152809401776,
  'e': 3.1439230427971863,
  'f': ['r', 'w', 'z', 'v', 'x', 'q', 't', 'q', 'v', 'w']}]

相关问题更多 >

编程相关推荐

热门问题

热门文章