在Pandas DataFrame、Spark Scala、Python Data Fram上执行自连接和聚合

2024-10-02 04:29:24 发布

您现在位置:Python中文网/ 问答频道 /正文

连接两个数据帧

团队、队长、比赛ID

A,      Jack,   13 
A,      Jack,   14
A,      Sam,    15 
B,      Nancy,  13
B,      Rob,    14
B,      Job,    15

队伍,队伍,比赛ID,比赛日期,获胜队伍

A           B       13      12011018    A
A           B       15      13011018    B

输出数据帧必须具有, 队伍,队伍,比赛ID,比赛日期,获胜队伍,

以及6附加字段,WinRationOfTeam\u LWinRationOfTeam\u RWinRationOfTeam\u L\u VS\u RWinRationOfCaptain\u LWinRationOfCaptain\u Rwinration\u Captain\u VS\u R

比如说

  • 我队与任何一支球队打了15场比赛,赢了10场,然后球队的胜率是10/15

    • WinRationOfCaptain\L与“杰克”一起组队由于队长与任何一支球队打了4场比赛,赢了1场,那么球队的胜率是1/4=0.25

    • A队与R队进行了5场比赛,赢了3场,A队的赢率是3/4=0.75

    • WinRatio\u Captain \u L u ON \u RA队打了3场比赛,杰克队长和B队比赛,罗伯担任队长,赢了2场,然后WinRatio\u Captain \u ON \u R=2/3=0.66

从一个角度来看,国家足球队在100场比赛中赢了85场, 比率为0.85 丹作为A队的队长,打了20场比赛,赢了20场比赛中的10场。 船长的温升为10/20,即0.5。你知道吗

A队和B队打了10场比赛,A队赢了6场,现在如果A队在Team\ L列下的输出数据框中,那么WinRationOfTeam\ L\ U VS\ U R是6/10=0.6

丹是A队的队长,吉姆是B队的队长,他打了4场,赢了3场。 那么 船长与船长之比是3/4=0.75


Tags: 数据idon团队vs船长jack球队

热门问题