读取HTML函数无法抓取Pokemono数据表

from bs4 import BeautifulSoup import pandas as pd import requests url = "https://www.pokemondb.net/pokedex/all" html = requests.get(url) soup = BeautifulSoup(html.text, "html.parser") dfs = pd.read_html(soup.table)

2条回答

网友

1楼 · 编辑于 2024-09-28 14:16:17

在read_html的文档中，您可以看到它不适用于https

你的第一个版本证实了这一点

在第二个版本中，您不需要BeautifulSoup

read_html()使用自己的bs4或lxml或html5-请参见文档中的选项flavor来选择它

import requests
import pandas as pd

url = "https://www.pokemondb.net/pokedex/all"
html = requests.get(url)

dfs = pd.read_html(html.text)

print(dfs)

网友

2楼 · 编辑于 2024-09-28 14:16:17

我希望它能帮助你

table = soup.findAll('table', attrs={'id':'pokedex'})

然后将表转换为字符串

 dfs = pd.read_table(str(table))

它会给你一个输出

编程相关推荐

Java如何关闭类共享
java我正在安卓中集成paytm all-in-one sdk，每次我都会得到一个成功的代码，但在安卓中主体是空的
OncreateView中的java意外NPE
java SOAP UI支持JCEKS密钥库吗？
java JDialog未显示最小化/关闭按钮
java数组出现问题，无法向其添加任何内容
安卓 java。单击按钮时出现lang.NullPointerException
单击后更改按钮样式
java使用循环分区分配策略提供CommitFailedException
java与屏幕底部的安卓相交

相关问题更多 >

编程相关推荐

热门问题

热门文章

读取HTML函数无法抓取Pokemono数据表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >