如何根据Python中的句数计算两个单词之间的距离?

2024-09-28 22:21:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,其中ij被提取到两个列表中。现在我必须检查ij是否在同一个句子中,它应该返回0,否则计算ij之间的句子数。你知道吗

a
b
c
<coref coref_coref_class="set_0" coref_mentiontype="ne" markable_scheme="coref" coref_coreftype="atr">
aa
bb
</coref>
,
<coref coref_coref_class="set_0" coref_mentiontype="np" markable_scheme="coref" coref_coreftype="atr">
aa
dd
ff
</coref>
 m
 n
 .
# first senetence end here

现在我只提取了标记ii_NP列表和jj_NP列表中的文本。如何包含.来检查ij是否在同一个句子中,然后返回0,否则返回1

i_NP = []
j_NP = []
find_coref = re.findall(r'<coref.*?coref_coref_class="set.*?>(.*?)</coref>', read_dataset, re.S)
coref_list = list(map(lambda x: x.replace('\n', ' '), find_coref))
for i in range(0,len(coref_list)-1,2):
    i_NP.append(str(coref_list[i]))
    j_NP.append(str(coref_list[i+1]))

Tags: re列表npfindlistclass句子aa