擅长:python、mysql、java
<p>一种可能的方法是使用单词嵌入来创建句子的向量表示。就像使用预先训练的单词嵌入,让rnn层创建一个句子向量表示,其中每个句子的单词嵌入是组合的。然后你有一个向量,你可以计算出两个物体之间的距离。但是你需要决定,你想要设定哪一个阈值,这样一个句子就被认为是相似的,因为单词嵌入的尺度是不固定的</p>
<p><strong>更新</strong></p>
<p>我做了一些实验。在我看来,对于这样的任务,这是一种可行的方法,但是,您可能想自己了解一下,它在您的情况下工作得有多好。我在git<a href="https://github.com/MichaelJanz/stackoverflow_examples/blob/master/sentence_similarity_with_tf.ipynb" rel="nofollow noreferrer">repository</a>中创建了一个示例</p>
<p>此外,单词移动距离算法也可用于此任务。您可以在此媒体<a href="https://medium.com/@adriensieg/text-similarities-da019229c894" rel="nofollow noreferrer">article</a>中找到有关此主题的更多信息</p>