当我试图创建我的语料库时,我在处理所有子文件夹中的文件时遇到了一些愚蠢的问题。在
CorpusList = CategorizedPlaintextCorpusReader('X:\\HardPath\\SF001\\SF001_009\\TextForAnalysis\\', r'.*/.txt', cat_file='CAT.txt', cat_delimiter=',')
我的问题是我所有的文本文件都不在一个文件夹中。它们都在子文件夹中。如何包含此目录和所有子目录中的所有文本文件?如果我把所有的文件都放在“TextForAnalysis”文件夹中,那么所有的工作都只是文件。在
尝试使用
cat_pattern
选项:相关问题 更多 >
编程相关推荐