Pandas:从选定列创建新数据帧

2024-09-29 01:20:11 发布

您现在位置:Python中文网/ 问答频道 /正文

很抱歉,如果有人问这个问题,我不知道它的关键字

假设我有一个具有500个特性的数据帧,我称之为df_raw。在功能选择过程之后,我设法获得了前50个功能。我想使用这些前50个特性来选择df_raw上的列,并从中生成一个新的数据帧,我如何实现这一点

基本上我想要这样的东西:

df_raw:

A   B   C   D   E   F   J   K   L   M
=====================================
0   1   0   1   1   1   0   1   0   0
1   0   0   1   1   0   0   0   1   1
1   1   1   0   0   1   1   0   0   1

前三大特征:C、J、L

new_df:

C   J   L
=========
0   0   0
0   0   1
1   1   0

只是规模更大

编辑2:添加我的真实数据帧

ad  addict  ade     adik    ah  aja     ajar    ak  akses   aktif   ...     warga   wkwk    wkwkw   wkwkwk  x   ya  yaa     yg  yuk     Sentimen
0   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
1   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
2   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   1   0   0   0   0
3   0   0   0   0   1   1   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
4   0   0   1   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
5   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
6   0   0   0   0   0   0   0   1   0   0   ...     0   0   0   0   0   0   0   0   0   0
7   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   1   0   0   0   0   0   0
8   0   0   0   0   0   1   0   0   0   0   ...     0   0   0   0   2   0   1   0   2   0
9   0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
10  0   0   0   0   0   1   0   0   0   1   ...     0   0   0   0   0   0   0   0   0   1
11  0   0   0   1   0   0   0   0   0   0   ...     0   0   2   0   0   0   0   0   0   1
12  0   0   0   0   0   3   1   0   1   0   ...     0   0   0   0   0   1   0   2   0   1
13  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   1   0   0   0   1
14  0   1   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   1
15  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   1
16  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   1
17  0   0   0   0   0   0   2   0   0   0   ...     0   0   0   0   0   0   0   1   0   1
18  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   1
19  0   0   0   0   0   1   0   0   0   0   ...     0   0   0   0   0   0   0   1   0   1
20  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   2
21  0   0   0   0   0   0   1   0   0   0   ...     1   0   0   0   0   0   0   1   0   2
22  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   2
23  0   0   0   0   0   1   0   0   0   0   ...     0   0   0   0   0   0   0   2   0   2
24  0   0   0   0   0   1   0   0   0   0   ...     0   1   0   0   0   0   0   0   0   2
25  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   2
26  0   0   0   0   0   0   1   0   0   0   ...     0   0   0   0   0   0   0   0   0   2
27  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   2
28  1   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   1   0   2
29  0   0   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   2

30 rows × 340 columns

前108项功能:

ade             0.000000
ah              0.000000
aja             0.030054
ajar            0.070682
ak              0.000000
alias           0.000000
ama             0.000000
anak            0.038516
auk             0.000000
banget          0.020754
bayarin         0.000000
beban           0.000000
biar            0.033700
bikin           0.000000
darurat         0.000000
dikerjainnya    0.000000
do              0.000000
dom             0.000000
emaknya         0.000000
ga              0.018862
gerak           0.000000
gerombol        0.000000
gimana          0.000000
gin             0.060764
gurune          0.000000
hemat           0.000000
i               0.000000
isi             0.000000
jakarta         0.000000
jarang          0.000000
                  ...   
rindu           0.000000
ringan          0.000000
rutin           0.000000
saking          0.000000
sampe           0.000000
sekolah         0.193896
sempat          0.000000
sempet          0.000000
sesuai          0.000000
smpe            0.000000
sni             0.000000
sragam          0.000000
stress          0.000000
t               0.000000
takut           0.000000
tambah          0.000000
taun            0.000000
tdk             0.000000
teknologi       0.000000
temennya        0.000000
test            0.000000
things          0.000000
to              0.000000
tp              0.021611
tukeran         0.000000
udah            0.000000
udh             0.000000
umur            0.000000
wajar           0.000000
yg              0.000000
Length: 108, dtype: float64

我希望能够根据前108个特性选择数据帧上的列,并从中创建一个新的数据帧


Tags: 数据功能dfraw过程关键字特征特性
1条回答
网友
1楼 · 发布于 2024-09-29 01:20:11

假设您有一个名为df的数据帧

如果要选择一列,只需将该列的名称传递到括号中,如df[name_of the_column]

如果要选择多个列,请以相同的方式传递名称列表:df[[list_of_columns]]

您提到了自动化,但这不是一个复杂的行为。所以,我不确定自动化能有什么帮助。我认为任何形式的自动化都会使它变得更加漫长和复杂

相关问题 更多 >