用NLTK加载平行语料库,并对英语句子进行词法化处理

2024-09-30 06:33:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个语料库,格式如下:

sentence in english \t sentence in french \t score
sentence in english \t sentence in french \t score

每个句子都被标记化(用whitespac分隔)。在

现在我需要用NLTK加载这些句子。我怎么能做到呢?我可以用血球阅读器里的什么方法?在

在这个例子中,我可以加载NLTK提供的comtrans语料库:

^{pr2}$

事实上,我需要做同样的事情,但我自己创建了一个文件。在

在最后一步,我需要将英语句子中的每个单词词组化。在


Tags: 方法in标记english格式sentence例子句子

热门问题