我使用BeautifulSoup通过lxml
解析器解析HTML。但是我遇到了一个文件,它在<table>
内没有任何结束标记:
<table id='reportTable' class='report-table' style='width:auto' cellspacing='0'><tr>
<th>Номер<br>поезда<th>Дата<br>отправления<th>Маршрут<th>Причина<th>Комментарий<th>Станция ...
尽管<table>
标记已正确关闭。在
Tags:
我个人也遇到过这个问题,我用tidylib在htmltidy5中运行整个文档。说我同意C.feenstralxml解析器可以容忍格式错误的html。如果您得到了无法使用lxml解析器解析的html,请尝试以下操作:
然后用“tidiedHtml”来表示美化组
相关问题 更多 >
编程相关推荐