我有一个这样的html表。尝试使用pandas.read_html和美丽的组合,。真让人沮丧,请帮帮我!!在
这是我最初的python代码:
url = 'http://financials.morningstar.com/ajax/keystatsAjax.html?t=wja&culture=en-CA®ion=CAN'
lm_json = requests.get(url).json()
ksContent = BeautifulSoup(lm_json["ksContent"],"html.parser")
table = ksContent.find("table", {'class': "r_table1 text2"})
jsonD = json.dumps(table.text)
jsonL = json.loads(jsonD)
“table”将有html表,但json转换生成纯文本。在
jsonD = json.dumps(htmlContent.text)
将原始HTML内容转换为JSON字符串表示形式。jsonL = json.loads(jsonD)
将JSON字符串解析回常规的string/unicode对象。这将导致no-op,因为dumps()
所做的任何转义都会被loads()
还原。jsonL
包含与htmlContent.text
相同的数据。在相关问题 更多 >
编程相关推荐