为什么我在使用Pandas应用程序时会得到属性错误？

category gender sub-category title health&beauty NaN makeup lipbalm health&beauty women makeup lipstick NaN NaN NaN lipgloss

def impute_gender(cols): category=cols[0] sub_category=cols[2] gender=cols[1] title=cols[3] if title.str.contains('Lip') and gender.isnull==True: return 'women' df[['category','gender','sub_category','title']].apply(impute_gender,axis=1)

3条回答

网友

1楼 · 编辑于 2024-05-19 13:32:47

如果我们应该使用NaN值，fillna可以是以下方法之一：-）

df.gender=df.gender.fillna(df.title.str.contains('lip').replace(True,'women'))
df
Out[63]: 
        category gender sub-category     title
0  health&beauty  women       makeup   lipbalm
1  health&beauty  women       makeup  lipstick
2            NaN  women          NaN  lipgloss

网友

2楼 · 编辑于 2024-05-19 13:32:47

或者简单地使用loc作为@COLDSPEED答案的选项3

cond = (df['gender'].isnull()) & (df['title'].str.contains('lip'))
df.loc[cond, 'gender'] = 'women'


    category        gender  sub-category    title
0   health&beauty   women   makeup          lipbalm
1   health&beauty   women   makeup          lipstick
2   NaN             women       NaN         lipgloss

网友

3楼 · 编辑于 2024-05-19 13:32:47

这里需要注意的是-

如果只使用两列，那么对4列调用apply是浪费
一般来说，调用apply是浪费的，因为它速度很慢，并且不会给您提供矢量化好处
在apply中，您处理的是标量，因此您不会像使用.str对象那样使用pd.Series访问器。title.contains就足够了。或者更严重的是，"lip" in title。
gender.isnull完全错误，gender是标量，它没有isnull属性

选项1
np.where

m = df.gender.isnull() & df.title.str.contains('lip')
df['gender'] = np.where(m, 'women', df.gender)

df
        category gender sub-category     title
0  health&beauty  women       makeup   lipbalm
1  health&beauty  women       makeup  lipstick
2            NaN  women          NaN  lipgloss

不仅速度快，而且简单。如果您担心区分大小写，可以让您的contains检查不区分大小写-

m = df.gender.isnull() & df.title.str.contains('lip', flags=re.IGNORECASE)

选项2
另一种方法是使用pd.Series.mask/pd.Series.where-

df['gender'] = df.gender.mask(m, 'women')

或者

df['gender'] = df.gender.where(~m, 'women')

df
        category gender sub-category     title
0  health&beauty  women       makeup   lipbalm
1  health&beauty  women       makeup  lipstick
2            NaN  women          NaN  lipgloss

mask根据提供的掩码隐式地将新值应用于列。

相关问题更多 >

编程相关推荐

热门问题

热门文章