打印到pd的连续增加的URL

2024-09-26 22:50:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个网站,它的网址以jobs/jif/id/1-jobs/jif/id/1298结尾,我需要把每一页打印成pdf。有一个陷阱。网站信息通过登录网站进行保护。这个问题我忽略了,直到我知道如何打印到pdf给定的网址

我试过用卷发,但那对我来说是个死胡同。我现在使用pdfkit打印每一页。我没有结婚使用pdfkit或python。如果我能找到一个蝙蝠文件就好了

import pdfkit

url = 'https://registration.vtbigevent.org/committee/jobs/jif/id/'
config = pdfkit.configuration(wkhtmltopdf="C:/Program Files/wkhtmltopdf/bin")
for ids in range(1,1298):
    new_url = url + str(ids)
    pdf = str(ids) + '.pdf'
    pdfkit.from_url(new_url, pdf, configuration=config)

它应该在一个文件夹中创建1298个PDF

实际结果是wkhtmltopdf的编译错误

PermissionError:[Errno 13]权限被拒绝:“C:/Program Files/wkhtmltopdf/bin”

另一个问题是,我知道这将不会保存到预期的文件夹的pdf文件,但这是低优先级现在

我编辑代码在pdfkit行中添加configuration=config。这和我想的一样吗?我仍然得到许可错误


Tags: 文件idconfigidsurlpdf网站jobs

热门问题