为Pandas中的每组生成唯一随机数的范围

District Prefix Quota A 98426 783 A 98427 223 A 98446 127 A 98626 51 B 98049 167 B 98079 153 B 98140 120 B 98159 139 B 98169 182 B 98249 86 B 98426 588 B 98446 96 C 98049 104 C 98060 68 C 98149 65 C 98150 68 C 98159 86 C 98160 80 C 98169 113

import pandas as pd df = pd.DataFrame([ ['A', 98426, 783], ['A', 98427, 223], ['A', 98446, 127], ['A', 98626, 51], ['B', 98049, 167], ['B', 98079, 153], ['B', 98140, 120], ['B', 98159, 139], ['B', 98169, 182], ['B', 98249, 86], ['B', 98426, 588], ['B', 98446, 96], ['C', 98049, 104], ['C', 98060, 68], ['C', 98149, 65], ['C', 98150, 68], ['C', 98159, 86], ['C', 98160, 80], ['C', 98169, 113] ], columns=['District', 'Prefix', 'Quota'])

2条回答

网友

1楼 · 编辑于 2024-06-16 11:58:06

这里有一个使用transform、random.choice和explode的解决方案

def make_random_numbers(x):
    total = x.sum()
    r = np.random.choice(range(99999), total, replace = False)
    chunks = x.cumsum()[:-1]
    res =  np.hsplit(r, chunks)  
    return res

df["rand_items"] = df.groupby("Prefix")["Quota"].transform(make_random_numbers)
df.explode("rand_items")

结果是：

  District  Prefix  Quota rand_items
0        A   98426    783       2681
0        A   98426    783      94952
0        A   98426    783      79496
0        A   98426    783      58361
0        A   98426    783      54883
0        A   98426    783      44819
0        A   98426    783      36209
0        A   98426    783      91710
...
18        C   98169    113      41859
18        C   98169    113      92311
18        C   98169    113      18572
18        C   98169    113      72492
18        C   98169    113      39188
18        C   98169    113      36808
18        C   98169    113      32055
18        C   98169    113      74678

网友

2楼 · 编辑于 2024-06-16 11:58:06

此方法返回每行的随机选择列表：

def gen_rand(x):
    return (x['Prefix'].min() * 1E5 + np.random.choice(range(99999),
        size=sum(x['Quota']), replace = False)).astype(int)
df.groupby('Prefix').apply(gen_rand)

相关问题更多 >

编程相关推荐

热门问题

热门文章