我有一个语料库,格式如下:
sentence in english \t sentence in french \t score
sentence in english \t sentence in french \t score
每个句子都被标记化(用whitespac分隔)。在
现在我需要用NLTK加载这些句子。我怎么能做到呢?我可以用血球阅读器里的什么方法?在
在这个例子中,我可以加载NLTK提供的comtrans语料库:
^{pr2}$事实上,我需要做同样的事情,但我自己创建了一个文件。在
在最后一步,我需要将英语句子中的每个单词词组化。在
目前没有回答
相关问题 更多 >
编程相关推荐