包含“上一行”条件和的DataFrame Add列

tennis_cols = ['Year','TourNo','MatchNo','Round','Winner','Loser'] tennis_rslts = [ [2018, 1, 1, 'QF', 'PlayerA', 'PlayerB'] ,[2018, 1, 2, 'QF', 'PlayerC', 'PlayerD'] ,[2018, 1, 3, 'QF', 'PlayerE', 'PlayerF'] ,[2018, 1, 4, 'QF', 'PlayerG', 'PlayerH'] ,[2018, 1, 5, 'SF', 'PlayerA', 'PlayerC'] ,[2018, 1, 6, 'SF', 'PlayerE', 'PlayerG'] ,[2018, 1, 7, 'F', 'PlayerA', 'PlayerE'] ] dfTennis=pd.DataFrame(tennis_rslts,columns=tennis_cols) dfTennis Year TourNo MatchNo Round Winner Loser 0 2018 1 1 QF PlayerA PlayerB 1 2018 1 2 QF PlayerC PlayerD 2 2018 1 3 QF PlayerE PlayerF 3 2018 1 4 QF PlayerG PlayerH 4 2018 1 5 SF PlayerA PlayerC 5 2018 1 6 SF PlayerE PlayerG 6 2018 1 7 F PlayerA PlayerE

Year TourNo MatchNo Round Winner Loser WinsToDate 0 2018 1 1 QF PlayerA PlayerB 0 1 2018 1 2 QF PlayerC PlayerD 0 2 2018 1 3 QF PlayerE PlayerF 0 3 2018 1 4 QF PlayerG PlayerH 0 4 2018 1 5 SF PlayerA PlayerC 1 <-- PlayerA won MatchNo 1 5 2018 1 6 SF PlayerE PlayerG 1 <-- PlayerE won MatchNo 3 6 2018 1 7 F PlayerA PlayerE 2 <-- PlayerA won MatchNo 1 and 5

1条回答

网友

1楼 · 发布于 2024-09-27 18:24:16

奇怪的是，我要回答我自己的问题。你知道吗

计算WinsToDate列所需的代码是：

dfTennis['WinsToDate'] = list(map(lambda x : len(dfTennis[(dfTennis['Winner'] == dfTennis.iloc[x]['Winner']) & 
                                                          (dfTennis['MatchNo'] < dfTennis.iloc[x]['MatchNo'])]), dfTennis.index.values))

通过将索引值传递给lambda函数，意味着我可以访问Winner和MatchNo字段中的数据来应用所需的逻辑。你知道吗

我很高兴听到任何更好的解决方案，但这似乎为我的需要工作。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章