避免使用try/except-when-webscraping-htm

try: reg_title = soup.find('p', {'class': "regnumber-e"}).text except AttributeError: try: reg_title = soup.find('p', {'class': "regtitle-e"}).text except AttributeError: reg_title = soup.find('p', {'class': "Yregnumber-e"}).text

if soup.find_all('p', {'class': "Notice"}): try: #More code except IndexError: #More code continue elif (soup.find_all('p', {'class': "ConsolidationPeriod-e"}) or soup.find_all('p', {'class': "ConsolidationPeriod"})): try: text = soup.find('p', {'class': "ConsolidationPeriod-e"}).text except AttributeError: text = soup.find('p', {'class': "ConsolidationPeriod"}).text elif soup.find('p', {'class': "Notice-e"}): #More code continue else: continue

1条回答

网友

1楼 · 发布于 2024-10-03 11:18:58

你能不能不只是try except所有的代码都捕获多个异常？比如：

try:
    # All your code
    # For exemple 
    # if soup.find_all('p', {'class': "Notice"}):
    #      ...
    # else:
    #      ...
except (AttributeError, IndexError) as e:
    continue

在我看来，对于你试图获取文本的部分地方，一个简单的测试就足够了

比如：

if soup.find('p', {'class': "ConsolidationPeriod-e"}):
    text = soup.find('p', {'class': "ConsolidationPeriod-e"}).get_text()
else:
    text = soup.find('p', {'class': "ConsolidationPeriod"}).text

或：

if soup.find('p', {'class': "regnumber-e"}):
    reg_title = soup.find('p', {'class': "regnumber-e"}).get_text()
elif soup.find('p', {'class': "regtitle-e"}):
    reg_title = soup.find('p', {'class': "regtitle-e"}).get_text()
else:
    reg_title = soup.find('p', {'class': "Yregnumber-e"}).get_text()

相关问题更多 >

编程相关推荐

热门问题

热门文章