尝试读取htm时发生urllib2.URLError

2024-06-25 23:28:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试用pandas读取html文件

我有以下代码:

state_names = pd.read_html('https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes')

但是运行此代码会产生以下错误

urllib2.URLError: urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:661)>

除了维基百科,其他任何网站都是这样 例如,运行这个程序就可以完美地工作

state_names = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')

除了wikipedia之外,还有什么解决方案可以获取html页面吗


Tags: 文件代码httpscompandasreadnameshtml
1条回答
网友
1楼 · 发布于 2024-06-25 23:28:17

试试这个方法..它会给你所有的HTML数据

import urllib2  

url = 'https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes'
response = urllib2.urlopen(url=url) 
html = response.read()
data = pd.read_html(html) 
print data

相关问题 更多 >