对pandas中的groupby函数很好奇,如何为通用数据集编写groupby?

2024-09-29 22:00:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我想为groupby编写一个泛型函数,假设我有一个大约有100列的数据集,例如它有70个分类列,30个数值属性,现在我想编写一个泛型python函数,它将只获取数据集,并以绘图或数据的形式显示相应的groupby结果,在我开始之前有什么专家建议吗

谢谢你, 湿婆


Tags: 数据函数绘图属性分类形式数值型函数
1条回答
网友
1楼 · 发布于 2024-09-29 22:00:50

您可以合并标准库中的随机模块,以获得所有数字列的随机样本

df = pd.DataFrame({
        'a': list('abcde'),
        'b': ['1','2','3','4','5'],
        'c': range(5),
        'd': [i*21 for i in range(5)],
        'e': [12,32,45,67,54]})

str_cols = df.select_dtypes(exclude='number').columns.tolist()
num_cols = random.sample(df.select_dtypes('number').columns.tolist(), k=2)
dff = df.loc[:, str_cols+num_cols]
print(dff)

   a  b   d  c
0  a  1   0  0
1  b  2  21  1
2  c  3  42  2
3  d  4  63  3
4  e  5  84  4

相关问题 更多 >

    热门问题