路径未打印字符串值

2024-07-01 08:16:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我最近发现这个非常方便的pdf转换库。我正在尝试将pdf转换为字符串值。以便解析数据并转换为csv文件。我想为将来自动化,所以我不能使用表格。你知道吗

我正在调用一些模块以便将pdf转换为字符串。 字符串转换部分不工作。(pdf2string.py) 下面是pdf转换为字符串的部分。你知道吗

我没有错。成功。但是,没有输出。你知道吗

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import HTMLConverter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
from cStringIO import StringIO
import re
import csv
import sys

def convert_pdf_to_html(path):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = HTMLConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)
    fp = file(path, 'rb')
    interpreter = PDFPageInterpreter(rsrcmgr, device)
    password = ""
    maxpages = 0 #is for all
    caching = True
    pagenos=set()
    for page in PDFPage.get_pages(fp, pagenos, maxpages=maxpages, password=password, caching=caching, check_extractable=True):
        interpreter.process_page(page)
    fp.close()
    device.close()
    str = retstr.getvalue()
    retstr.close()
    return str

    print str

if __name__ == '__main__':
    if len(sys.argv) == 2:
        path = sys.argv[1]
        convert_pdf_to_html(path)

这是我的狂欢。你知道吗

python pdf2string.py example.pdf

脚本是pdf2string.py,路径是example.pdf。你知道吗

我对python中的高级逻辑也很陌生。你知道吗


Tags: path字符串frompyimportpdfdevicesys
1条回答
网友
1楼 · 发布于 2024-07-01 08:16:37

编辑:打印前返回-删除return str,或删除print str,并使用下面的建议。你知道吗

您没有打印convert\u pdf\u to \u html()的输出,也没有将其保存在某个位置。你知道吗

print convert_pdf_to_html(path)

相关问题 更多 >

    热门问题