作为初学者,我正在参加泰坦尼克号挑战赛,但是pandas.replace()
似乎有问题。代码如下:
df['Title'].replace(['Miss', 'Mlle','Mrs', 'Dona', 'Lady', 'Mme'], 'Ms', inplace = True)
df['Title'].replace(['Mr', 'Sir', 'Don'], 'Ms', inplace = True)
df['Title'].replace(['Jonkheer', 'Capt', 'the Countess', 'Major', 'Col', 'Dr', 'Rev', 'Master'], 'Ms', inplace = True)
df['Title']
当我使用上述代码时,数据不会改变:
Miss 260
Mrs 197
Master 61
Dr 8
Rev 8
Col 4
Ms 2
Mlle 2
Major 2
Jonkheer 1
Mme 1
Lady 1
Dona 1
Don 1
the Countess 1
Capt 1
Sir 1
Name: Title, dtype: int64
这里有什么问题
尝试以下列方式使用正则表达式:
df.Title = df.Title.str.replace(r'Miss|Mlle|Mrs|Dona|Lady|Mme','Ms')
同样,您也可以替换其他标题
相关问题 更多 >
编程相关推荐