我使用PyPDF2从PDF文件中提取数据,然后转换成文本格式?在
文件的PDF格式如下:
Name : John
Address: 123street , USA
Phone No: 123456
Gender: Male
Name : Jim
Address: 456street , USA
Phone No: 456899
Gender: Male
在Python中,我使用以下代码:
^{pr2}$这是我从第页内容得到的结果:
'Name : John \n \nAddress: 123street , USA \n \nPhone No: 123456\n \nGender: Male \n \n \nName : Jim \n \nAddress: 456street , USA \n \nPhone No: 456899\n \nGender: Male \n \n \n'
如何将其格式化为JSON或XML格式,以便使用sqlserver数据库中提取的数据。在
我也试过用这种方法
import json
data = json.dumps(page_content)
formatj = json.loads(data)
print (formatj)
输出:
Name : John
Address: 123street , USA
Phone No: 123456
Gender: Male
Name : Jim
Address: 456street , USA
Phone No: 456899
Gender: Male
这与word文件中的输出相同,但我不认为这是JSON格式。在
不是很漂亮,但我想这能完成任务。您将得到一个字典,然后由json解析器以漂亮的格式打印出来。在
或者,代替最后三行,只需这样做:
^{pr2}$相关问题 更多 >
编程相关推荐