使用selenium抓取HTML表

2024-09-29 21:23:27 发布

您现在位置:Python中文网/ 问答频道 /正文

每次我的代码单击下一页和scrapetable时,我都试图使用selenium web驱动程序python来刮取每页HTML表,但我无法这样做,因为我不明白如何使用python代码每次单击这些数字。因此,我在这里共享HTML代码

<div class="dataTables_paginate paging_full_numbers" id="orgSanitarias_paginate">
<a class="paginate_button first disabled" aria-controls="orgSanitarias" data-dt-idx="0" tabindex="0" id="orgSanitarias_first"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">First</font></font></a>
<a class="paginate_button previous disabled" aria-controls="orgSanitarias" data-dt-idx="1" tabindex="0" id="orgSanitarias_previous"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">Previous</font></font></a>
<span>
<a class="paginate_button current" aria-controls="orgSanitarias" data-dt-idx="2" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">one</font></font></a>
<a class="paginate_button " aria-controls="orgSanitarias" data-dt-idx="3" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">two</font></font></a>
<a class="paginate_button " aria-controls="orgSanitarias" data-dt-idx="4" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">3</font></font></a>
<a class="paginate_button " aria-controls="orgSanitarias" data-dt-idx="5" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">4</font></font></a>
<a class="paginate_button " aria-controls="orgSanitarias" data-dt-idx="6" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">5</font></font></a>
<span><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">…</font></font</span>
<a class="paginate_button " aria-controls="orgSanitarias" data-dt-idx="7" tabindex="0"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">38</font></font></a></span>
<a class="paginate_button next" aria-controls="orgSanitarias" data-dt-idx="8" tabindex="0" id="orgSanitarias_next"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">Next</font></font></a>
<a class="paginate_button last" aria-controls="orgSanitarias" data-dt-idx="9" tabindex="0" id="orgSanitarias_last"><font style="vertical-align: inherit;"><font style="vertical-align: inherit;">Last</font></font></a></div>`

enter image description here

我需要关于代码的想法,如何通过每次点击数字来获取页面的表格,从而刮取html表格。谢谢..任何帮助都将不胜感激


Tags: datastyledtbuttoninheritclassfontpaginate

热门问题