Pandas：基于来自

1条回答

网友

1楼 · 发布于 2024-09-30 00:30:22

我的建议是在这里使用np.select。你设置好你的条件，你的输出，你就可以走了。但是，为了避免迭代，但是也为了避免为满足条件的每个列分配相同的随机值，请创建与数据帧长度相等的随机值，并从中进行选择：

设置

df = pd.DataFrame({
    'Name': ['Chris', 'John'],
    'Height': [72, 84],
    'Pos': ['PG', 'C'],
    'Weight': [165, 235], 
    'Shot': ['Amazing', 'Fair'],
    'Points': [999, 25]
})

    Name  Height Pos  Weight     Shot  Points
0  Chris      72  PG     165  Amazing     999
1   John      84   C     235     Fair      25

现在设置您的范围和条件（根据您的需要创建任意多个）：

^{pr2}$

    Name  Height Pos  Weight     Shot  Points  InsideScoring
0  Chris      72  PG     165  Amazing     999             72
1   John      84   C     235     Fair      25             89

现在要验证这不会多次指定值：

df = pd.concat([df]*5)

... # Setup the ranges and conditions again

df.assign(InsideScoring=np.select([cond1, cond2], [range1, range2]))

    Name  Height Pos  Weight     Shot  Points  InsideScoring
0  Chris      72  PG     165  Amazing     999             56
1   John      84   C     235     Fair      25             96
0  Chris      72  PG     165  Amazing     999             74
1   John      84   C     235     Fair      25             93
0  Chris      72  PG     165  Amazing     999             63
1   John      84   C     235     Fair      25             97
0  Chris      72  PG     165  Amazing     999             55
1   John      84   C     235     Fair      25             95
0  Chris      72  PG     165  Amazing     999             60
1   John      84   C     235     Fair      25             90

我们可以看到随机值被分配，即使它们都符合两个条件中的一个。虽然这比迭代和随机选取一个随机值的内存效率要低，因为我们要创建大量未使用的数字，但由于这些都是矢量化操作，因此速度仍然会更快。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：基于来自

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >