我有下面这样的dataframe,我想通过替换列的唯一值来降低它的敏感度。i、 e.我想用一些从“faker”库生成的假姓氏替换姓氏列
代码片段如下所示
import pandas as pd
from faker import Faker
fake = Faker()
print(fake.first_name())
print(fake.last_name())
last = ('Meyer', 'Maier', 'Meyer', 'Mayer', 'Meyr', 'Mair')
job = ('data analyst', 'programmer', 'computer scientist',
'data scientist', 'accountant', 'psychiatrist')
language = ('Python', 'Perl', 'Java', 'Java', 'Cobol', 'Brainfuck')
df = pd.DataFrame(list(zip(last, job, language)),
columns =['last', 'job', 'language'],
index=first)
我想要的输出是用假名字更改姓氏列,但例如,Meyer应该总是用相同的假姓氏替换
获取所有唯一名称,创建映射唯一名称的词典->;伪造名称,并将其映射到您的列:
输出:
相关问题 更多 >
编程相关推荐