迭代数据帧以创建PDF文档

2024-09-27 22:36:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个导入为Pandas数据框的工作表,如下所示:

文件名文件路径日期Pagestart PageEnd

文件1路径1日期1 5 10

文件2路径2日期2 20 100

我的目标是遍历dataframe并根据指定的页面范围为每一行创建一个PDF。第一行应该通过从file1中提取第5-10页来创建一个新的PDF,第二行应该通过从file2中提取第20-100页来构建一个新的PDF。在

我很难找到一个好的方法,首先,遍历一个数据帧,然后根据页面范围创建PDF。有一种很容易遍历数据帧的方法吗?有没有一个模块可以创建pdf文件,我可以在其中指定一个页面范围(我以前用过PyPDF2和.getPage()一起使用,但是我不认为它只允许一个页面范围,而是一个值)?在

编辑:我想我找到了一个很好的方法来遍历dataframe,但是仍然在寻找构建PDF的方法。以下是我的迭代:

i = 0
for row in df.iterrows():
    iteration = df.iloc[i]
    i +=1

Tags: 文件数据方法路径目标dataframepandasdf
1条回答
网友
1楼 · 发布于 2024-09-27 22:36:20
import PyPDF2
import os

for row in df.itertuples():
    page_start, page_end = row.PageStart, row.PageEnd
    output_filename = generate_output_name
    filename = os.path.join(row.FilePath, row.FileName)
    with PdfFileMerger() as merger:
        merger.append(filename, pages=(page_start, page_en))
        merger.write(output_filename)

相关问题 更多 >

    热门问题