阅读python中所有类型的文件

2024-05-19 05:06:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用python(.pdf.doc.docx)从不同类型的文件中提取信息并转换为.txt,但在处理不同的文件时,我会在不需要时获得空间和换行符,以及许多其他问题。我试过PyPDF2和PDF经理,拜托建议我一些可以从文件中提取信息的东西。在

编辑

目前正在寻找一些东西,可以帮助我提取准确的文本从.pdf文件。我试过PyPDF、PDFMiner和PDF Manager,但我发现它们中的一些PDF都有问题。在


Tags: 文件txt信息编辑类型docpdf空间

热门问题