Python将HTML表转换为json

2024-10-01 02:37:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个这样的html表。尝试使用pandas.read_html和美丽的组合,。真让人沮丧,请帮帮我!!在

这是我最初的python代码:

url = 'http://financials.morningstar.com/ajax/keystatsAjax.html?t=wja&culture=en-CA&region=CAN'
lm_json = requests.get(url).json()
ksContent = BeautifulSoup(lm_json["ksContent"],"html.parser")
table = ksContent.find("table", {'class': "r_table1 text2"})
jsonD = json.dumps(table.text)
jsonL = json.loads(jsonD)

“table”将有html表,但json转换生成纯文本。在


Tags: 代码jsonhttpurlpandasreadhtmltable
1条回答
网友
1楼 · 发布于 2024-10-01 02:37:40

jsonD = json.dumps(htmlContent.text)将原始HTML内容转换为JSON字符串表示形式。jsonL = json.loads(jsonD)将JSON字符串解析回常规的string/unicode对象。这将导致no-op,因为dumps()所做的任何转义都会被loads()还原。jsonL包含与htmlContent.text相同的数据。在

相关问题 更多 >