在python3.x中替换字符串中的转义序列字符

#import sys import re String = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r" splitString = String.split('\n') replacedStrings = [] i=0 for oneString in splitString: #oneString = oneString.replace(r'^(.?)*(\\[^n])+(.?)*$', "") oneString = re.sub(r'^(.?)*(\\[^n])+(.?)*$', "", oneString) print(oneString) replacedStrings.insert(i, oneString) i += 1 print(replacedStrings)

3条回答

网友

1楼 · 编辑于 2024-09-29 17:20:14

你就快到了，我就用string.strip()替换字符串开头和结尾的多个\r和\n

String = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r"
splitString = String.split('\n')
replacedStrings = []
i=0

for oneString in splitString:
    s = oneString.strip()
    if s != '':
        print(s)
        replacedStrings.append(s)

print(replacedStrings)

输出看起来像

1
2
3
4
['1', '2', '3', '4']

对于"jkahdjkah \r\r\t\r\nA: B\r\r\nA : B\r\r\r\r\n\r\n\r4\n\r"，输出将是['jkahdjkah', 'A: B', 'A : B', '4']

网友

2楼 · 编辑于 2024-09-29 17:20:14

您可能会发现使用re.findall这里的简单模式\S+更容易：

input = "1\r\r\t\r\n2\r\r\n3\r\r\r\r\n\r\n\r4\n\r"
output = re.findall(r'\S+', input)
print(output)

['1', '2', '3', '4']

这种方法将隔离和匹配由一个或多个非空白字符组成的孤岛。你知道吗

编辑：

根据您的新输入数据，我们可以尝试匹配模式[^\r\n\t]+：

input = "jkahdjkah \r\r\t\r\nA: B\r\r\nA : B\r\r\r\r\n\r\n\r4\n\r"
output = re.findall(r'[^\r\n\t]+', input)
print(output)

['jkahdjkah ', 'A: B', 'A : B', '4']

re.sub并不是这里工作的合适工具。表上的内容是split或re.findall，因为您希望重复匹配/隔离文本的某个部分。re.sub对于获取字符串并将其转换为其他内容非常有用。它可以用于提取文本，但对于多个匹配项来说效果不太好。你知道吗

网友

3楼 · 编辑于 2024-09-29 17:20:14

我又找到了一种方法，这似乎很有效，它可能不像其他答案那样优化，但它只是另一种方法：

import re
splitString = []
String = "jhgdf\r\r\t\r\nA  : B\r\r\nA  : B\r\r\r\r\n\r\n\rA: B\n\r"
splitString = re.compile('[\r\t\n]+').split(String)
if "" in splitString:
  splitString.remove("")
print(splitString)

我在这里加了这个词，所以和我一样经历麻烦的人可能也会忽略这个方法。你知道吗

下面是我使用上述代码后得到的输出：

['jhgdf', 'A  : B', 'A  : B', 'A: B']

相关问题更多 >

编程相关推荐

热门问题

热门文章