我有一个如下的数据帧:
df = {'id': [1,2,3,4,5,6,7], 'name': [Zeke,such,a,Maya,Derek,an,the]}
顺便说一下,这是一个巨大的数据帧。 现在我想找出错误的名字列表,比如“such”,“a”,“an”,“the”。 我想把它们去掉,做一个df,比如:
df_new= {'id': [1,4,5], 'name': [Zeke,Maya,Derek]}
我已经试着通过以下方法找到每个特定的错误名称:
df.query('name=="a"')
df1.query('name=="an"')
df1.query('name=="the"')
问题是,我不知道有多少不同的错误名称存在。正确名称和错误名称之间的唯一区别是第一个字母(samll或大写)
感谢您的帮助
使用^{} 检查按^{} 筛选的大写字母的第一个字符:
或者通过索引获取第一个值并通过^{} 进行检查:
为获得更好的性能,无缺失值使用列表理解:
相关问题 更多 >
编程相关推荐