使用pandas read_html()从我的大学网站上抓取表格时遇到的问题

2024-09-28 03:24:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个项目,需要从我的大学网站上抓取网页。大学的校址是https://erp.aktu.ac.in/WebPages/OneView/OneView.aspx。当我输入卷号(ex-1513310******从001到100)时,结果会显示出来,但当我复制URL并再次在浏览器中粘贴时,它会将我重定向到再次输入卷号。我假设在从pd.read_html()函数中提取时也会发生同样的事情。有没有办法绕过它

import pandas as pd
>>> pd.read_html('https://erp.aktu.ac.in/WebPages/OneView/OVEngine.aspx?enc=NnCOpTxI4+e2v6OtxoLaIVhtGRRyQHWhl51tE9IxJAlzwgkcwHudd8EEQQF6+chV')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python36\lib\site-packages\pandas\io\html.py", line 1100, in read_html
    displayed_only=displayed_only,
  File "C:\Python36\lib\site-packages\pandas\io\html.py", line 915, in _parse
    raise retained
  File "C:\Python36\lib\site-packages\pandas\io\html.py", line 895, in _parse
    tables = p.parse_tables()
  File "C:\Python36\lib\site-packages\pandas\io\html.py", line 213, in parse_tables
    tables = self._parse_tables(self._build_doc(), self.match, self.attrs)
  File "C:\Python36\lib\site-packages\pandas\io\html.py", line 545, in _parse_tables
    raise ValueError("No tables found")
ValueError: No tables found

显示错误是因为无法获取结果页。有什么解决办法吗


Tags: inpyioselfpandastablesparselib

热门问题