使用已知列值更改pandas数据帧的多个列中的值

2024-10-03 00:19:51 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有这样一个数据帧:

Knownvalue    A    B    C    D    E    F    G    H
  17.3413     0    0    0    0    0    0    0    0
  33.4534     0    0    0    0    0    0    0    0

我想做的是当known值在0-10之间时,A从0变为1。当Knownvalue在10-20之间时,B从0变为1,依此类推。在

更换后应该是这样的:

^{pr2}$

有人知道如何运用一种方法来改变它吗?在


Tags: 数据方法knownpr2knownvalue
2条回答

另一种方法是使用^{}从Knownvalue列重建帧:

>>> import string
>>> new_cols = pd.get_dummies(df["Knownvalue"]//10).loc[:,range(8)].fillna(0)
>>> new_cols.columns = list(string.ascii_uppercase)[:len(new_cols.columns)]
>>> pd.concat([df[["Knownvalue"]], new_cols], axis=1)
   Knownvalue  A  B  C  D  E  F  G  H
0     17.3413  0  1  0  0  0  0  0  0
1     33.4534  0  0  0  1  0  0  0  0

get_dummies努力工作:

^{pr2}$

我首先将Knownvalue系列放入一个整数列表中,这个整数等于它的截断值除以10(例如27.87//10=2)。这些桶表示所需列位置的整数。因为Knownvalue在第一列中,所以我在这些值中添加了一个。在

接下来,我通过这些bin值进行枚举,这有效地为我提供了行和列整数索引的元组对。我使用iat将这些位置的值设置为1。在

import pandas as pd
import numpy as np

# Create some sample data.
df_vals = pd.DataFrame({'Knownvalue': np.random.random(5) * 50})
df = pd.concat([df_vals, pd.DataFrame(np.zeros((5, 5)), columns=list('ABCDE'))], axis=1)

# Create desired column locations based on the `Knownvalue`.
bins = (df.Knownvalue // 10).astype('int').tolist()
>>> bins
[4, 3, 0, 1, 0]

# Set these locations equal to 1.
for idx, col in enumerate(bins):
    df.iat[idx, col + 1] = 1  # The first column is the `Knownvalue`, hence col + 1

>>> df
   Knownvalue  A  B  C  D  E
0   47.353937  0  0  0  0  1
1   37.460338  0  0  0  1  0
2    3.797964  1  0  0  0  0
3   18.323131  0  1  0  0  0
4    7.927030  1  0  0  0  0

相关问题 更多 >