用于操作pdf页码和标签的python库。
pagelabels的Python项目详细描述
页面标签python库
这是一个基于pdfrw的小库,它有助于在python中操作pdf页面标签。 它可以解析pdf中的页面标签,编辑页面标签,并将它们写入pdf中。
有关页面标签的详细信息,请参见:https://www.w3.org/TR/WCAG20-TECHS/PDF17.html
课程
页面标签
从列表继承并表示PageLabelScheme
s的列表。
PageLabels.from_pdf(pdfrwobj)
静态方法。 从pdfreader对象读取页面标签。
。写入(pdfrwobj)
将页面标签写入pdfreader对象。
页面标签模式
从具有字段的命名元组继承:
startpage
:pdf中的索引,从何处开始根据此方案对页面进行编号style
:字符串之一arabic
,roman uppercase
,letters uppercase
,roman lowercase
,letters lowercase
prefix
:所有页面标签前的字符串firstpagenum
:索引的起始位置
示例
frompdfrwimportPdfReader,PdfWriterfrompagelabelsimportPageLabels,PageLabelSchemereader=PdfReader("input.pdf")labels=PageLabels.from_pdf(reader)newlabel=PageLabelScheme(startpage=3,# the index of the page of the PDF where the labels will startstyle="roman",# See options in PageLabelScheme.styles()prefix="Appendix ",firstpagenum=1)# number to attribute to the first page of this indexlabels.append(newlabel)# Adding our page labels to the existing oneslabels.write(reader)writer=PdfWriter()writer.trailer=readerwriter.write("optput.pdf")