fi中的正则表达式重新列表

2024-09-28 18:47:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个文本列表,可以用类似于:re.sub('0000', '1111',data)的文本列表来重新定义。

对于shell中的一个输入,用\1\4\2\3替换模式^(.{4})(.{4})(.{3})(.{3}) 工作也很好。但是,我尝试在列表中使用此模式时 第一排出现不良结果,切勿更换车床。我错过了什么?

"0000-22N-06W-01"
"0000-22N-06W-02"
"0000-22N-06W-03"
"0000-22N-06W-04"

import re
o = open("output.txt","w")
data = open("input.txt").read()
o.write(re.sub(r'^(.{4})(.{4})(.{3})(.{3})', r'\1\4\2\3',data))
o.close()

Tags: 文本importretxt列表readinputoutput
3条回答

如果仍要使用.read(),请尝试以下操作:

import re
output = open("output.txt","w")
input = open("input.txt").read()

output.write(re.sub(r'^(.{4})(.{4})(.{4})(.{3})$',
                    r'\1\4\2\3', 
                    input, 
                    flags=re.M))

output.close()

这个?以下内容:

import re

t = """0000-22N-06W-01
0000-22N-06W-02\t\t
0000-22N-06W-03   \t\t\t\t
0000-22N-06W-04"""
print t,'\n'

print re.sub(r'^(.{4})(.{4})(.{4})([^ \t\r\n]+)',
             r'\1\4\2\3',
             t,
             flags= re.M)

产生

0000-22N-06W-01
0000-22N-06W-02     
0000-22N-06W-03                 
0000-22N-06W-04 

0000-01-22N-06W
0000-02-22N-06W     
0000-03-22N-06W                 
0000-04-22N-06W

很久以前,我花了1个小时才明白,regex表达式需要在flags=之后编写re.M,因为re.sub的签名是re.sub(pattern, repl, string, count=0, flags=0)

"0000-22N-06W-01"
"0000-22N-06W-02"
"0000-22N-06W-03"
"0000-22N-06W-04"

import re
output = open("output.txt","w")
input = open("input.txt")

for line in input:
    output.write(re.sub(r'^(.{4})-(.{3})-(.{3})-(.{2})$', r'\1-\4-\2-\3', line))

input.close()
output.close()

注意:如果您的数据中确实有",那么您应该将正则表达式更改为:

^"(.{4})-(.{4})-(.{3})-(.{3})"$

Regex101 Demo

相关问题 更多 >