我正在使用win32com将.docx文件转换为.txt文件。它工作得很好,直到它得到无法识别的西班牙语字符。在
DOC_FILEPATH = r"C:\Temp\Hugo- Ortíz -.docx"
s = find_between_r(DOC_FILEPATH, '.', '')
FILETXT = DOC_FILEPATH.strip(s)
FILETXT = FILETXT + "txt"
doc = win32com.client.GetObject(DOC_FILEPATH)
text = doc.Range().Text
with open(FILETXT, "wb") as f:
f.write(text.encode("utf-8"))
当win32时com.客户端读取DOC\u文件路径,我得到这个错误
^{pr2}$有没有办法在不更改文件名的情况下读取该文件?在
这不是Word Automation的工作原理。查看Word对象模型([MS.Docs]: Word)以获取更多详细信息。在
您应该创建一个
Word.Application
实例,它将处理文档。在我改编了[SO]: Python - Using win32com.client to accept all changes in Word Documents,并在一个虚拟文档上测试了它。在
代码.py:
注意事项:
输出:
相关问题 更多 >
编程相关推荐