用python中的自定义分隔符读取块中的文件

#!/usr/bin/python import re sample = """ TY - RPRT2 A1 - Peter T1 - Something ER - TY - RPRT3 A1 - Peter2 T1 - Something else ER - TY - RPRT4 A1 - Peter3 T1 - Similar ER - """ def blocks2(text): """Only non-comment blocks *between* comments""" buff = [] for line in text.split('\n'): if line.startswith('TY -'): if buff: yield "\n".join(buff) buff = [] else: buff.append(line) if buff: yield "\n".join(buff) for block in blocks2(sample): print "Block:\n%s" % (block)

2条回答

网友

1楼 · 编辑于 2024-09-30 03:24:53

我假设您希望按以下要求处理每个块的txt文件块：

块的第一行有前缀TI -
最后一行只有ER -
块可以包含前缀为A1 -或T1 -的行
一个块包含的每个前缀不应超过一行。你知道吗

可以使用条件变量构造dict。假设fd是文件对象或行列表：

inbloc = False
for line in fd:
    if inbloc:
        if line.startswith('A1  -'):
            if 'A1' in bloc:
                inbloc = False
            else:
                bloc['A1'] = line[5:].strip()
        elif line.startswith('T1  -'):
            if 'T1' in bloc:
                inbloc = False
            else:
                bloc['T1'] = line[5:].strip()
        elif line.strip() == 'ER  -':
            # process bloc
            print (bloc)
        else:
            inbloc = False
    elif line.startswith('TY  -'):
        bloc = { 'TY' : line[5:].strip() }

使用sample字符串作为输入，可以得到：

{'A1': 'Peter', 'T1': 'Something', 'TY': 'RPRT2'}
{'A1': 'Peter2', 'T1': 'Something else', 'TY': 'RPRT3'}
{'A1': 'Peter3', 'T1': 'Similar', 'TY': 'RPRT4'}

网友

2楼 · 编辑于 2024-09-30 03:24:53

print sample.split("\n\n")

我想会有用的。。。你知道吗

或者也许

 filter(str.strip,map(lambda x:x.rsplit("TY -",1)[-1],sample.split("ER  -")))

相关问题更多 >

编程相关推荐

热门问题

热门文章