如何使用列数据字段进行随机samp

2024-07-04 16:24:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我知道如何从数据帧中随机抽取几行

使用sample命令

df_sample = df.sample(n=10)

不过,我需要的是下面数据框中的随机列(即村庄)

Dummy Data:

例如:我想随机选择3个村庄的全部数据,即A村、B村和;C.A村、B村和;将随机选择C,并将这3个村庄的全部数据输出给我们

同样地

enter image description here

这是我的密码

>>> import pandas as pd
>>> import numpy as np
>>> df=pd.read_excel("/home/Study.xlsx")
>>> df=df.sample(n=3)
>>> df
    Sr.No  ...  Village
16     17  ...        I
33     34  ...        Q
36     37  ...        S

所以,我需要,如果村庄I,Q和S是随机选择的,那么我需要这3个村庄的全部数据

谢谢


Tags: 数据sampleimport命令numpy密码pandasdf
1条回答
网友
1楼 · 发布于 2024-07-04 16:24:58

对随机3个村庄使用具有唯一值的^{},然后按^{}^{}过滤:

vil = np.random.choice(df['Village'].unique(), 3)
df = df[df['Village'].isin(vil)]

只有^{}^{}的溶液:

vil = df['Village'].drop_duplicates().sample(3)
df = df[df['Village'].isin(vil)]

对于函数使用:

def random_vil(x):
    vil = np.random.choice(df['Village'].unique(), x)
    return df[df['Village'].isin(vil)]

 df = random_vil(3)

相关问题 更多 >

    热门问题