2024-06-02 21:16:50 发布
网友
我已经下载了Wikipedia文件的转储(13.40gb)。它以enwiki-latest-pages-articles.xml.bz2格式下载。在
enwiki-latest-pages-articles.xml.bz2
如何在Python中加载文件,然后将文章转换为纯文本文件,以便对其执行LDA?在
遵循mhttps://radimrehurek.com/gensim/wiki.html中的说明,但是没有提到将数据加载到Python中。在
运行以下代码:
python -m gensim.scripts.make_wiki filepath
其中filepath是enwiki-latest-pages-articles.xml.bz2的文件路径。在
[来自gensim: Experiments on the English Wikipedia&;基于@Holjer Just's注释]
运行以下代码:
其中filepath是
enwiki-latest-pages-articles.xml.bz2
的文件路径。在[
来自gensim: Experiments on the English Wikipedia&;基于@Holjer Just's注释]相关问题 更多 >
编程相关推荐