擅长:python、mysql、java
<p>NLTK是Python最常用的NLP库。
所述操作如下:</p>
<pre><code>from nltk.corpus import wordnet
house = wordnet.synset('house.n.01')
station = wordnet.synset('station.n.01')
</code></pre>
<p>然后您可以按如下方式使用类<a href="https://nltk.googlecode.com/svn/trunk/doc/api/nltk.corpus.reader.wordnet.Synset-class.html" rel="noreferrer">Synset</a>的方法:</p>
^{pr2}$
<p>要确定它们是否是同义词:</p>
<pre><code>common_lemmas = len(set(house.lemma_names).intersection(set(station.lemma_names)))
</code></pre>
<p>它将返回这两个集合中常见引理的数目。在</p>
<p>您还可以使用像Neo4j这样的图形数据库来加载wordnet数据集,并寻找节点之间的最短路径,这是一个讨论的问题<a href="https://groups.google.com/forum/#!topic/gremlin-users/lzS8aNrUq1U" rel="noreferrer">here</a>。在</p>