如何在urllib中捕获404错误？（Python3）

2024-10-01 11:40:11 发布

您现在位置：Python中文网/ 问答频道 /正文

523

网友

男 | 程序猿一只，喜欢编程写python代码。

我已经阅读了几十个类似问题的例子，但是我无法得到任何我看到的解决方案或它们的变体来运行。我正在抓屏，我只想忽略404个错误（跳过页面）。我明白了

“AttributeError:”module“对象没有属性”HTTPError“。

我也试过“urleror”。我已经看到了几乎相同的语法作为工作答案。有什么想法吗？我得到的是：

import urllib
import datetime
from bs4 import BeautifulSoup

class EarningsAnnouncement:
    def __init__(self, Company, Ticker, EPSEst, AnnouncementDate, AnnouncementTime):
        self.Company = Company
        self.Ticker = Ticker
        self.EPSEst = EPSEst
        self.AnnouncementDate = AnnouncementDate
        self.AnnouncementTime = AnnouncementTime

webBaseStr = 'http://biz.yahoo.com/research/earncal/'
earningsAnnouncements = []
dayVar = datetime.date.today()
for dte in range(1, 30):
    currDay = str(dayVar.day)
    currMonth = str(dayVar.month)
    currYear = str(dayVar.year)
    if (len(currDay)==1): currDay = '0' + currDay
    if (len(currMonth)==1): currMonth = '0' + currMonth
    dateStr = currYear + currMonth + currDay
    webString = webBaseStr + dateStr + '.html'
    try:
        #with urllib.request.urlopen(webString) as url: page = url.read()
        page = urllib.request.urlopen(webString).read()
        soup = BeautifulSoup(page)
        tbls = soup.findAll('table')
        tbl6= tbls[6]
        rows = tbl6.findAll('tr')
        rows = rows[2:len(rows)-1]
        for earn in rows:
            earningsAnnouncements.append(EarningsAnnouncement(earn.contents[0], earn.contents[1],
            earn.contents[3], dateStr, earn.contents[3]))
    except urllib.HTTPError as err:
        if err.code == 404:
            continue
        else:
            raise

    dayVar += datetime.timedelta(days=1)

Tags： import self datetime contents urllib company rows ticker

1条回答

网友

1楼 · 发布于 2024-10-01 11:40:11

对于urllib（而不是urllib2），异常是urllib.error.HTTPError，而不是urllib.HTTPError。有关详细信息，请参见documentation。

如何在urllib中捕获404错误？（Python3）

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在urllib中捕获404错误？（Python3）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >