XMLCorpusReader没有创建语料库

2024-09-22 14:25:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用python的nltk学习自然语言处理。我要在我的一个目录中创建一个XML文件。所以我用了下面的代码。在

>> from nltk.corpus import XMLCorpusReader
>> corpus_root = "/Desktop/my_dir/corpus/"
>> wiki = XMLCorpusReader(corpus_root ,'output.xml')
>> wiki.fileids()
>>

此代码块应该将fileid输出为'输出.xml'但它不返回任何内容,光标将移到下一行“>;”。 我有我的输出.xml在corpus_root指定的确切目录中。 我有读写文件的所有权限'输出.xml'. 我安装了nltk及其所有数据,并具有所有指定的路径。在

我该怎么做才能让它成功呢?在


Tags: 文件代码fromimport目录mydirwiki
1条回答
网友
1楼 · 发布于 2024-09-22 14:25:32

让我们浏览一下您的代码:

from nltk.corpus import XMLCorpusReader
corpus_root = "/Desktop/my_dir/corpus/"

我对这个路径名有点怀疑(请看这个答案:https://stackoverflow.com/a/6617625/583834)。可能应该是/usr/my_username/Desktop/my_dir/corpus。打开终端窗口,导航到目录并执行pwd以获得{a2},以确保路径正确。然后把它复制到上面。在

^{pr2}$

XMLCorpusReader读取目录以及该目录中已存在的文件名列表。这里的第二个参数是输入文件名,而不是输出名。(注意第三个“如何做”部分here,用于相关的WordListCorpusReader:reader = WordListCorpusReader('.', ['wordlist'])的一个示例调用)

wiki.fileids()

很可能你没有从最后一行中得到任何东西,因为前两行没有正确使用。在

相关问题 更多 >