擅长:python、mysql、java
<p>这是两个不同的问题。在</p>
<p>1)Wordnet和python。使用NLTK,它有一个很好的<a href="http://nltk.googlecode.com/svn/trunk/doc/howto/wordnet.html" rel="nofollow">interface to wordnet</a>。你可以自己写一些东西,但老实说,为什么让生活变得困难?Lingpipe可能还内置了一些东西,但NLTK更容易使用。我认为nltk只是下载了一个ntlk数据库,但我很确定有api可以与wordnet对话。在</p>
<p>2)在nltk <a href="http://jaganadhg.freeflux.net/blog/archive/2009/07/15/finding-bigrams-with-nltk.html" rel="nofollow">follow this tutorial</a>中获取bigrams。一般来说,你将文本标记化,然后通过向前和向后看,遍历句子,得到每个单词的n个单词。在</p>