回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我的目标是确定两个句子是否重复。你知道吗</p>
<p>我试着比较这两个句子的语法树。
我已经按照以下格式从解析器树中提取了标记</p>
<p/><div class="snippet" data-lang="js" data-hide="false" data-console="true" data-babel="false">
<div^{cl2}$
<pre class="snippet-code-html lang-html prettyprint-override"><code>['ROOT', 'SBARQ', 'WHADVP', 'WRB', 'SQ', 'VP', 'VBP', 'ADJP', 'RB', 'JJ', 'NP', 'NNP', 'NP', 'NP', 'NNS', 'VP', 'VBG', 'NP', 'NP', 'NNS', 'SBAR', 'WHNP', 'WDT', 'S', 'VP', 'VBP', 'ADVP', 'RB', 'VP', 'VBN', 'PP', 'IN', 'NP', 'NNP', '.']
['ROOT', 'SBARQ', 'WHADVP', 'WRB', 'SQ', 'VBP', 'NP', 'NNS', 'VP', 'VB', 'NP', 'NP', 'NNP', 'NNS', 'SBAR', 'WHNP', 'WDT', 'S', 'VP', 'MD', 'VP', 'VB', 'VP', 'VBN', 'ADVP', 'RB', 'PP', 'IN', 'NP', 'NNP', '.']</code></pre>
</div>
</div>
<p>我想得到两个列表的公共子列表的长度。在上述情况下,结果将是4('ROOT','SBARQ','WHADVP','WRB')+5('SBAR','WHNP','WDT','S','VP')+2('ADVP','RB')+5('PP','In','NP','NNP','。你知道吗</p>
<p>或者你有没有其他的解决方案可以利用解析树来实现两个句子的相似性。
还有一个问题是,获取解析树的最快方法是什么?因为我有30多万个句子对要比较。。。你知道吗</p>
<p>提前谢谢!你知道吗</p>