Python-NLTK分类语料库创建

2024-09-27 07:20:02 发布

您现在位置:Python中文网/ 问答频道 /正文

当我试图创建我的语料库时,我在处理所有子文件夹中的文件时遇到了一些愚蠢的问题。在

CorpusList = CategorizedPlaintextCorpusReader('X:\\HardPath\\SF001\\SF001_009\\TextForAnalysis\\', r'.*/.txt', cat_file='CAT.txt', cat_delimiter=',')

我的问题是我所有的文本文件都不在一个文件夹中。它们都在子文件夹中。如何包含此目录和所有子目录中的所有文本文件?如果我把所有的文件都放在“TextForAnalysis”文件夹中,那么所有的工作都只是文件。在


Tags: 文件目录txt文件夹catfile语料库文本文件

热门问题