在Python中有没有办法解释字符串中的所有分隔符?

2024-05-04 02:33:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试为一本书(.txt文件)创建字数,并尝试使用以下方法将每一行拆分为单独的字:

temp = re.split('[; |, |\*|\n| |\|:|.|’|"|&|#|$|(|)|]|//|'']', line)

但是,这不起作用,因为每次运行程序时,我都必须向列表中添加另一个分隔符。这次我必须加上“-”和“%”。我记得在Java中做过类似的事情,我可以指定一个分隔符的“范围”,当我在这里尝试同样的事情时,它似乎不起作用

有没有更好的方法来做到这一点,并确保我只是得到这个词,而不是别的


Tags: 文件方法程序retxt列表linejava
1条回答
网友
1楼 · 发布于 2024-05-04 02:33:29

我想您正在寻找\W,所有非单词字符的集合,即不是字母、数字或下划线

temp = re.split('\W+', line)

顺便说一下,正则表达式字符集中的字符大部分是文字。你的结论可以归结为:

[; |,*\n:.’"&#$()]/']

相关问题 更多 >