for if循环在条件下分类

g['Category'] = "" for i in g['NumFloorsGroup']: if i == '0-9' or i == '10-19': g['Category'] = 'LowFl' elif i == '50~': g['Category'] = 'HighFl' else: g['Category'] = 'NormalFl'

<class 'pandas.core.frame.DataFrame'> Int64Index: 596 entries, 128 to 595 Data columns (total 4 columns): YearBuilt 596 non-null int64 NumFloorsGroup 596 non-null category Count 596 non-null int64 Category 596 non-null object dtypes: category(1), int64(2), object(1)

bins = [0, 10, 20, 30, 40, 50, np.inf] labels = ['0-9', '10-19', '20-29', '30-39', '40-49', '50~'] copy = original_data.copy() copy['NumFloorsGroup'] = pd.cut(copy['NumFloors'], bins=bins, labels=labels, include_lowest=True) g = (copy.groupby(['YearBuilt', 'NumFloorsGroup'])['YearBuilt'] .count() .reset_index(name="Count") .sort_values(by='Count', ascending=False))

g['Category'] = "" for i in g['NumFloorsGroup']: if i == '0-9' or i == '10-19': g['Category'] = 'LowFl' elif i == '50~': g['Category'] = 'HighFl' else: g['Category'] = 'NormalFl'

3条回答

网友

1楼 · 编辑于 2024-09-30 10:29:42

解决方案不起作用的原因是没有迭代数据帧。因此，要更正您的解决方案，与其直接将其分配给列，不如将值附加到列表中，然后稍后再将列表分配给数据帧。你知道吗

category = []
for i in g['NumFloorsGroup']:
    if i == '0-9' or i == '10-19':
        category.append('LowFl')
    elif i == '50~':
        category.append('HighFl')
    else:
        category.append('NormalFl')

g.assign(category = category)

网友

2楼 · 编辑于 2024-09-30 10:29:42

我建议将^{}函数更改为新的bin和新的标签，因为最好的方法是避免pandas中的循环，因为如果存在一些向量化函数，则速度较慢：

df = pd.DataFrame({'Floors':[0,1,10,19,20,25,40, 70]})

bins = [0, 10, 20, 30, 40, 50, np.inf]
labels = ['0-9', '10-19', '20-29', '30-39', '40-49', '50~']

df['NumFloorsGroup'] = pd.cut(df['Floors'], 
                              bins=bins, 
                              labels=labels,
                              include_lowest=True)

df['Category'] = pd.cut(df['Floors'], 
                        bins=[0, 19, 50, np.inf], 
                        labels=['LowFl','NormalFl','HighFl'],
                        include_lowest=True)

print (df)
   Floors NumFloorsGroup  Category
0       0            0-9     LowFl
1       1            0-9     LowFl
2      10            0-9     LowFl
3      19          10-19     LowFl
4      20          10-19  NormalFl
5      25          20-29  NormalFl
6      40          30-39  NormalFl
7      70            50~    HighFl

或者使用^{}和dictionary with ^{}替换dict（NaNs）中没有的值，替换为NormalFl：

d = { "0-9": 'LowFl',  "10-19": 'LowFl',"50+": 'HighFl'}
df['Category']  = df['NumFloorsGroup'].map(d).fillna('NormalFl')

网友

3楼 · 编辑于 2024-09-30 10:29:42

你可以试试这个：

d = {
  "0-9": 'LowFl',
  "10-19": 'LowFl',
  "10-19": '50~',
}
g['NumFloorsGroup'].map(lambda key: d.get(key, 'NormalFl'))

相关问题更多 >

编程相关推荐

热门问题

热门文章