我有一个字节码字符串和所有匹配的字节码中的开始和结束索引(来自文本编辑器)。你知道吗
例如mystring
:
a few names with accents are Emily Brontë, Noël Coward, Zoë Wanamaker
当我搜索包含ë
的单词时,我会在文本编辑器中找到这些(字节码)索引:matches = [[35, 43], [44, 49], [58, 62]]
现在我想使用python p.e.在这些匹配中搜索,以找到字母o
的所有子字符串,并在mystring
中找到这些o
的新字节码。你知道吗
newmatches = []
for n in matches:
for m in reg.finditer(str(mystring[n[0]:n[1]], 'utf-8')):
newmatches.append([m.start(), m.end()])
在上面的示例中,start()和end()不是字节码,也不是mystring
中的索引,而是子字符串中的索引。你知道吗
如何解决这个问题?你知道吗
拥有
matches
数组之后,在mystring
上进行第二次搜索,在那里可以找到o
的索引(我们称这个新数组为o_matches
)。然后遍历o_matches
中的项,如果该项包含在matches
数组的任何间隔中,则将其添加到newmatches
,因为这意味着它是包含重音的单词的一部分。你知道吗要获取
mystring
中的索引而不是子字符串中的索引,您需要将n[0]
的值添加到start()和end()中。你知道吗相关问题 更多 >
编程相关推荐