gensim图书馆的维基语料库在阿拉伯语维基百科转储上有效吗？

1条回答

网友

1楼 · 发布于 2024-09-29 17:18:47

它应该可以工作，特别是如果阿拉伯语有明确的单词分隔符（如单词之间的空格）

然而，考虑到gensim&；大多数相关的Python数据科学库在其他地方得到了更多的开发/测试/使用；在多处理方面存在一些Windows特有的奇怪之处。如果你可以选择在另一个操作系统上工作，这会使事情变得更容易

最近还有一个问题描述了en转储的类似问题&WikiCorpus–有一些想法需要检查my answer there，但不清楚询问者是否解决了问题

此外，在Windows中使用依赖Python multiprocessing的代码时，可能特别需要将代码设置为“主”块，如果其他进程重新导入文件，则不会重新运行该块，并调用Windows特定的freeze_support()函数。见some recent discussion of a related matter on the gensim project list

编程相关推荐

使用java在mysql中使用外键插入到表中
java Android按类别筛选列表
java对JGoodies外观的更改
java如何在Drools规则中推断中间值
用于虚拟拆分文本文件的java解决方案
使用XML的java Android UI（Android和XML）
使用ApachePOI库将工作表适配到xlsx文件中的单个页面时遇到的java问题
java类型为javafx。fxml。FXMLLoader不可访问（vscode）
java所有计划的作业都在运行，即使提到了节点id
java将大整数打印到文本文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

gensim图书馆的维基语料库在阿拉伯语维基百科转储上有效吗？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >