基于其他列创建数据帧列

2024-09-27 23:25:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有columns[id, type, income]的数据帧,并希望根据收入添加一个名为incomebracket的额外列。有人有什么建议吗?在

理想情况下,我将基于一系列间隔创建新的incomebracket列。即:

incomebracket = 1 if 100000 < income < 150000

{cd4>我不知道如何创建一个空的列。在

有什么建议吗?在

干杯


Tags: columns数据id间隔iftype情况建议
2条回答

您可能对^{}感兴趣:

>>> df = pd.DataFrame({"income": np.random.uniform(0, 10**6, 10)})
>>> df["incomebracket"] = pd.cut(df.income, np.linspace(0, 10**6, 11))
>>> df
          income     incomebracket
0  474229.041695  (400000, 500000]
1  128577.241314  (100000, 200000]
2  254345.417166  (200000, 300000]
3  622104.725105  (600000, 700000]
4   93779.964789       (0, 100000]
5  865556.464985  (800000, 900000]
6  304711.799685  (300000, 400000]
7  601910.710932  (600000, 700000]
8  229606.880350  (200000, 300000]
9   49889.911661       (0, 100000]

[10 rows x 2 columns]

另请参见^{}。在

试试这个

df['incomebracket'] = 0 #default
df.incomebracket[(df.income >= 100000) & (df.income < 150000)] = 1

我最喜欢的方法是在哪里使用numpy

^{pr2}$

相关问题 更多 >

    热门问题