删除Pandas中具有特殊字符的所有行

2024-09-28 05:38:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧,其中一列EPI_ID中有特殊字符(如正方形)。我要删除包含此特殊字符的所有行。这不是一个标准字符,我在数据帧中也没有发现类似的问题,主要是字符串。然而,我很难识别这些列。有什么建议吗?在

测向

EPI_ID    stuff
2342F     randoM_words
FER43     predictive_words
u'\u25A1' blank

我的尝试:

^{pr2}$

我的结果每排都是假的。在

预期产量:

EPI_ID    stuff
2342F     randoM_words
FER43     predictive_words

编辑:这个方块在模拟测向中没有出现。但这就是square


Tags: 数据字符串id标准random字符建议words
1条回答
网友
1楼 · 发布于 2024-09-28 05:38:44

假设您的DataFrame如下所示:

>>> df = pd.DataFrame({'EPI_ID': ['2343F', 'FER43', 'DF' + u'\u25A1' + '123', 'PQRX74'], 'STUFF': ['abc', 'def', 'ghi', 'jkl']})

>>> df

   EPI_ID STUFF
0   2343F   abc
1   FER43   def
2  DF□123   ghi
3  PQRX74   jkl

您可以使用处理regex的^{}

^{pr2}$

Regex提供此答案:(grep) Regex to match non-ASCII characters?

相关问题 更多 >

    热门问题