打开.docx文件地址列表

2024-06-26 00:04:13 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一个树状的文件夹层次结构。一个包含子目录和更多子目录的根文件夹,最后它们都有一个我需要访问的.docx文件

到目前为止,我已经设法收集了列表中所有.docx文件的地址。我试图直接执行我想执行的操作(通过pythondocx读取.docx文件并从中创建csv),但没有成功。那么,我有没有办法一个接一个地读取列表中的地址,然后打开然后做我想做的事情

from docx import Document
import os

def getListOfFiles(dirName):
    # create a list of file and sub directories
    # names in the given directory
    listOfFile = os.listdir(dirName)
    allFiles = list()
    # Iterate over all the entries
    for entry in listOfFile:
        # Create full path
        fullPath = os.path.join(dirName, entry)
        # If entry is a directory then get the list of files in this 
directory
        if os.path.isdir(fullPath):
            allFiles = allFiles + getListOfFiles(fullPath)
        else:
            allFiles.append(fullPath)

    return allFiles

dirName = r'path' ;
# Get the list of all files in directory tree at given path
listOfFiles = getListOfFiles(dirName)

print(len(listOfFiles))
for i in listOfFiles:
print(i)

#     document = Document('i.docx')
#     for p in document.paragraphs:
#         print("---------------")
#         print (p.text)
#         print("----------------")

Tags: 文件ofthepathinforosdirectory