我有一个这样的数据帧
column_name
0 OnePlus phones never fail to meet my expectatiion.
1 received earlier than expected for local set.
2 \n
3 good
4 must buy!
5 \t
6
7 awesome product!
8 \n
我想删除其中只包含\n
、\t
、、
\n
的所有行
输出应如下所示:
column_name
0 OnePlus phones never fail to meet my expectatiion.
1 received earlier than expected for local set.
2 good
3 must buy!
4 awesome product!
我尝试了以下方法:
df = df[df.column_name != '\n'].reset_index(drop=True)
df = df[df.column_name != ''].reset_index(drop=True)
df = df[df.column_name != ' '].reset_index(drop=True)
df = df[df.column_name != ' '].reset_index(drop=True)
df = df[df.column_name != ' \n '].reset_index(drop=True)
但是,有没有一种更优雅的方法或一种类似于Python的方法来代替重复代码呢
您可以使用^{} 并仅比较空字符串:
或将空值转换为布尔值:
或者过滤词,对我来说是必要的
strip
(可能在真实数据中strip
应该被删除):如果需要删除缺少的值且没有字符串值,请将这些值替换为} :
NaN
s,然后使用^{使用df.str.contains()检查正斜杠后是否有小的alpha
在您的情况下,数据:
解决方案
另一种方法是删除条目与标记元素匹配的行:
如果最后一行(或其他行)中有多余的空格,您可以首先执行以下操作:
相关问题 更多 >
编程相关推荐