所以我有一个树状的文件夹层次结构。一个包含子目录和更多子目录的根文件夹,最后它们都有一个我需要访问的.docx
文件
到目前为止,我已经设法收集了列表中所有.docx
文件的地址。我试图直接执行我想执行的操作(通过pythondocx读取.docx
文件并从中创建csv),但没有成功。那么,我有没有办法一个接一个地读取列表中的地址,然后打开然后做我想做的事情
from docx import Document
import os
def getListOfFiles(dirName):
# create a list of file and sub directories
# names in the given directory
listOfFile = os.listdir(dirName)
allFiles = list()
# Iterate over all the entries
for entry in listOfFile:
# Create full path
fullPath = os.path.join(dirName, entry)
# If entry is a directory then get the list of files in this
directory
if os.path.isdir(fullPath):
allFiles = allFiles + getListOfFiles(fullPath)
else:
allFiles.append(fullPath)
return allFiles
dirName = r'path' ;
# Get the list of all files in directory tree at given path
listOfFiles = getListOfFiles(dirName)
print(len(listOfFiles))
for i in listOfFiles:
print(i)
# document = Document('i.docx')
# for p in document.paragraphs:
# print("---------------")
# print (p.text)
# print("----------------")
目前没有回答
相关问题 更多 >
编程相关推荐