2024-06-14 08:34:49 发布
网友
在我的一个文件夹中,总共有5个word(.docx)文件,我想在dataframe中读取和存储这些文件的内容
我能够在Python中使用以下语法读取一个文件。谁能帮我如何读取存储在一个文件夹中的多个docx文件并将结果保存在dataframe中
我也不确定在特定的文件夹中可用的docx文件的名称。在
import docx2txt # extract text text = docx2txt.process("file.docx")
我可以得到结果使用下面的脚本
这应该是有效的:
import os directory = '.' extension = '.docx' text = '' for a_file in os.listdir(directory): if a_file.endswith(extension): text = docx2txt.process(a_file)
使用glob获取文件夹中的所有文件,然后使用for loop并将输出附加到变量中。在
glob
for loop
import glob text = '' for file in glob.glob('folder_name/*.docx'): text += docx2txt.process(file)
这应该是有效的:
使用
glob
获取文件夹中的所有文件,然后使用for loop
并将输出附加到变量中。在相关问题 更多 >
编程相关推荐