从pdf格式的表中提取json格式的清晰数据

2024-06-01 13:34:24 发布

您现在位置：Python中文网/ 问答频道 /正文

5677

网友

男 | 程序猿一只，喜欢编程写python代码。

我有下面的PDF文件，我想从中获取其中的数据，以便与我的应用程序集成

例如，我想得到1表示星期一，10和14表示有白色框的列

以下是我尝试过的：

 import tabula
 df = tabula.read_pdf("IT.pdf",multiple_tables=True)
 for col in df: 
 print(col)

输出结果如下所示

          07:00 08:00  08:00 09:00  Unnamed: 0  Unnamed: 1  ... Unnamed: 10  07:00 08:00.1 Unnamed: 11  08:00 09:00.1
0            Tutorial     Tutorial         NaN         NaN  ...         NaN       Tutorial         NaN            NaN
1              G1_MSU     G1G2G3_M         NaN         NaN  ...         NaN      SPU_07410         NaN            NaN
2               07201     TU 07203         NaN         NaN  ...         NaN            110         NaN            NaN
3                 110    110, 115,         NaN         NaN  ...         NaN     Andaray, N         NaN            NaN
4        Lema, F (Mr)          117         NaN         NaN  ...         NaN           (Mr)         NaN            NaN
5           BscIRM__1     Farha, M         NaN         NaN  ...         NaN      BIRM__2PT         NaN            NaN
6                   C       (Mrs),         NaN         NaN  ...         NaN            NaN         NaN            NaN
7                 NaN    Mandia, A         NaN         NaN  ...         NaN            NaN         NaN            NaN
8                 NaN        (Ms),         NaN         NaN  ...         NaN            NaN         NaN            NaN
9                 NaN  Wilberth, N         NaN         NaN  ...         NaN            NaN         NaN            NaN
10                NaN         (Ms)         NaN         NaN  ...         NaN            NaN         NaN            NaN
11                NaN    BscIRM__1         NaN         NaN  ...         NaN            NaN         NaN            NaN
12                NaN            C         NaN         NaN  ...         NaN            NaN         NaN            NaN
13           Tutorial     Tutorial         NaN         NaN  ...         NaN       Tutorial         NaN       Tutorial
14             G4_MSU       G3_MTU         NaN         NaN  ...         NaN      AFT_05204         NaN      BFT_05202
15              07201        07203         NaN         NaN  ...         NaN            110         NaN            110

Tags：文件数据应用程序 df pdf col nan tutorial

1条回答

网友

1楼 · 发布于 2024-06-01 13:34:24

使用卡米洛特包装。那会对你有帮助的

从pdf格式的表中提取json格式的清晰数据

相关问题更多 >

编程相关推荐

热门问题

热门文章

从pdf格式的表中提取json格式的清晰数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >