更改数据帧的索引：获取属性错误

mean std count min max HHT 1.0 106790.565562 100888.917804 25495.0 -5100.0 1425000.0 5.0 79659.567376 74734.380152 1410.0 0.0 625000.0 7.0 69055.725901 63871.751863 1193.0 0.0 645000.0 2.0 64023.122122 59398.970193 1998.0 0.0 610000.0 3.0 49638.428821 48004.399101 5718.0 -5100.0 609000.0 4.0 48545.356298 60659.516163 5835.0 -5100.0 681000.0 6.0 37282.245015 44385.091076 8024.0 -11200.0 676000.0

2条回答

网友

1楼 · 编辑于 2024-10-03 19:33:02

使用dict映射到map带有HHT标签的HHT数值将更加健壮：

hht_map = {
    1: 'Married couple household',
    2: 'Nonfamily household:Male',
    3: 'Nonfamily household:Female',
    4: 'Other family household:Male',
    5: 'Other family household:Female',
    6: 'Nonfamily household:Male',
    7: 'Nonfamily household:Female',
}
df.index = df.index.map(hht_map)
print(df)

^{tb1}$

编辑：在分组之前，请在pums_df上尝试映射

使用map创建一个新的label列：

pums_df['label'] = pums_df.HHT.map(hht_map)

使用新的label到groupby：

table = pums_df['HINCP'].groupby(pums_df['label'])

网友

2楼 · 编辑于 2024-10-03 19:33:02

>>> df = pd.DataFrame(columns = ["HHT", "HINC"], data = np.transpose([[2,3,2,2,2,3,3,3,4], [1,1,3,1,4,7,8,9,11]]))
>>> df
   HHT  HINC
0    2     1
1    3     1
2    2     3
3    2     1
4    2     4
5    3     7
6    3     8
7    3     9
8    4    11
>>> table = df['HINC'].groupby(df['HHT'])
>>> td = table.describe()
>>> df2 = pd.DataFrame(td)
>>> df2.index = ['lab1', 'lab2', 'lab3']
>>> df2
      count   mean       std   min   25%   50%    75%   max
lab1    4.0   2.25  1.500000   1.0   1.0   2.0   3.25   4.0
lab2    4.0   6.25  3.593976   1.0   5.5   7.5   8.25   9.0
lab3    1.0  11.00       NaN  11.0  11.0  11.0  11.00  11.0

相关问题更多 >

编程相关推荐

热门问题

热门文章