我想用pyPdf2获得PDF索引的dataflame
import PyPDF2
def show_tree(bookmark_list, indent=0):
for item in bookmark_list:
if isinstance(item, list):
# recursive call with increased indentation
show_tree(item, indent + 4)
else:
print(" " * indent + item.title)
reader = PyPDF2.PdfFileReader("[your filename]")
show_tree(reader.getOutlines())
我修改了这个函数如下
def show_bookmark(bookmark_list, indent=0):
IndexDataFrame = pd.DataFrame(index=[], columns=['IndexLevel', 'Title'])
for item in bookmark_list:
if isinstance(item, list):
# recursive call with increased indentation
show_bookmark(item, indent + 1)
else:
record = pd.Series([indent, item.title], index=IndexDataFrame.columns)
IndexDataFrame = IndexDataFrame.append(record, ignore_index=True)
#print(indent, item.title)
return IndexDataFrame
但是,IndexDataFrame
不包括所有数据,只包括indexLeve为0的数据
我只想将前一个函数的数据打印为数据帧的一种类型
目前没有回答
相关问题 更多 >
编程相关推荐