擅长:python、mysql、java
<p>你可以用熊猫和地球仪来阅读它们。看看这个例子:</p>
<p>在glob的帮助下,我们可以读取所有的txt文件并将它们放入一个数据帧中</p>
<pre><code>import pandas as pd
from glob import glob
txts = sorted(glob('*.txt'))
df = pd.concat((pd.read_csv(file, sep=',') for file in txts),ignore_index=True)
</code></pre>
<p>对于提取id和其他东西,可以使用regex和nltk</p>