NYC USA - LND UK
GBKTG-U
DUB AE- EUUSA
USA -TY
SG !S
CNZOS !C SEA
GAGAX"T
AEU DGR# UK,GBR
import re
f = open("sample.txt", "r")
txt = f.read()
dest = []
r = re.findall(r"(.*?)[^\w\s](.*)", txt)
for f in r:
if sum([i.isalpha() for i in f[1]]) >= 5:
dest.append(f[1].strip())
else:
dest.append(f[0].strip())
print(dest)
使用正则表达式组在
origin
和destination
之间分割每一行,根据需要调整separator
([^\w\s]
)。接下来,计算分隔符符号右侧的字母数,检查指定的字母数详细信息:
(.*?)
:捕获组-零个或多个字符(行尾除外)非灰色[^\w\s]
:后跟不是字母、数字、下划线([a-z-a-Z0-9_])或空格的任何字符(.*)
:捕获组-零个或多个字符(行尾除外)文件sample.txt用作输入
相关问题 更多 >
编程相关推荐