我试图通过爬行表格来练习使用pandas的read_html函数,但我遇到了一个错误。我的代码如下:
import pandas as pd
url = "https://www.pokemondb.net/pokedex/all"
dfs = pd.read_html(url)
上面的代码返回了错误,无法运行,因此我尝试了下面的代码,但仍然无法运行
from bs4 import BeautifulSoup
import pandas as pd
import requests
url = "https://www.pokemondb.net/pokedex/all"
html = requests.get(url)
soup = BeautifulSoup(html.text, "html.parser")
dfs = pd.read_html(soup.table)
我不知道到底是怎么回事。有人能给我一些启发吗
谢谢
在read_html的文档中,您可以看到它不适用于
https
你的第一个版本证实了这一点
在第二个版本中,您不需要
BeautifulSoup
read_html()
使用自己的bs4
或lxml
或html5
-请参见文档中的选项flavor
来选择它我希望它能帮助你
然后将表转换为字符串
它会给你一个输出
相关问题 更多 >
编程相关推荐