擅长:python、mysql、java
<p>我不是NLTK专家,所以可能有一种更简单的方法来实现这一点,但我天真地建议您使用<a href="http://docs.python.org/library/glob.html" rel="nofollow">Python's ^{<cd1>} module</a>。它支持Unix stle路径名模式扩展。在</p>
<pre><code>from glob import glob
texts = glob('nltk_data/corpora/nytimes/*')
</code></pre>
<p>这样就可以以列表形式给出与指定表达式匹配的文件名。
然后,根据您希望/需要一次打开的数量,您可以:</p>
^{pr2}$
<p>正如@waffle paradox:所建议的那样,您还可以将<code>texts</code>的列表缩减以满足您的特定需求。在</p>