合并几个文本。用于主题建模的多行csv文件(1行=1个文档)

2024-09-27 04:23:13 发布

您现在位置:Python中文网/ 问答频道 /正文

到目前为止,我有30个文本文件,它们都有多行。我想应用一个基于this tutorial的LDA模型。 所以,对我来说,应该是这样的:

text of document1
text of document2
text of document3 
.....
text of document30

但是特定文档的整个文本必须在一行上

我试过this post,出于某种原因,它一直在说:csv_output.writerow(row[1] for row in csv_text) IndexError: list index out of range。有什么想法吗?当然,我用同样的方式命名了文档,并编辑了范围

基本上,我不在乎我们能否用python解决这个问题。我已经不再紧张了,所以我真的很感谢你的帮助


Tags: ofcsvtext文档模型文本thistutorial
2条回答

循环文件1到31(最后一个被range()函数跳过:

with open("lda_datafile.csv", "w", newline="") as wf:
    csv_output = csv.writer(wf)
    for x in range(1, 31):
        filepath = os.path.normpath(r"C:\Text\file{}.txt".format(x))
        with open(filepath, "r", newline="") as rf:
            csv_text = csv.reader(rf, delimiter=":", skipinitialspace=True)
            csv_output.writerow(row[1] for row in csv_text)

我不太确定您想要完成什么,但是要删除文本文件的换行符并生成一个包含结果的大文本文件,以下几点应该可以实现:

for i in *.txt; do NEW=` cat $i | tr '\n' ' '` ; echo $NEW  >> output.txt; done

相关问题 更多 >

    热门问题