文件读取和重新解析

f = open('d:\BB.ki', "rb") f10 = re.findall( b'\x03\x00\x00\x10''(.*?)''\xF7\x00\xF0', f.read() ) print f10 ['1BBBAAAABBBBAAAABBBBAAAABBBBAAAA\x00'] f = open('d:\BB.ki', "rb") f11 = re.findall( b'\x03\x00\x00\x11''(.*?)''\xF7\x00\xF0', f.read() ) print f11 ['2AAABBBBAAAABBBBAAAA\x00']

f = open('d:\BB.ki', "rb") f10 = re.findall( b'\x03\x00\x00\x10''(.*?)''\xF7\x00\xF0', f.read() ) f11 = re.findall( b'\x03\x00\x00\x11''(.*?)''\xF7\x00\xF0', f.read() ) print f10,f11 ['1BBBAAAABBBBAAAABBBBAAAABBBBAAAA\x00'] **[]**

2条回答

网友

1楼 · 编辑于 2024-07-07 00:09:09

在调用f.read()之后，没有更多的字节可读取，因此对f.read()的第二次调用将返回一个空字符串。存储f.read（）的结果，而不是读取两次：

s = f.read()
f10 = re.findall( b'\x03\x00\x00\x10''(.*?)''\xF7\x00\xF0', s)
f11 = re.findall( b'\x03\x00\x00\x11''(.*?)''\xF7\x00\xF0', s)

您可能还希望只扫描一次数据，找到两个表达式：

matches = re.findall( b'\x03\x00\x00[\x10\x11]''(.*?)''\xF7\x00\xF0', s)

如果您的文件包含字节'\x03\x00\x00\x10\x03\x00\x00\x11_\xF7\x00\xF0'，您提出的方法将找到两个重叠的匹配（\x03\x00\x00\x11_和_），而单扫描方法只找到一个匹配。你知道吗

网友

2楼 · 编辑于 2024-07-07 00:09:09

f.read()使用整个文件。只有f10会出现。你知道吗

试试这个。你知道吗

 for line in open('d:\BB.ki', "rb").readlines():
    f10 = re.findall( b'\x03\x00\x00\x10''(.*?)''\xF7\x00\xF0', line )
    f11 = re.findall( b'\x03\x00\x00\x11''(.*?)''\xF7\x00\xF0', line )

相关问题更多 >

编程相关推荐

热门问题

热门文章