解析活动不稳定,得到一些随机结果

2024-03-29 12:22:59 发布

您现在位置:Python中文网/ 问答频道 /正文

代码如下:

# -*- coding: utf-8 -*-
import urllib2
from bs4 import BeautifulSoup

with open('/users/Rachael/Desktop/CheckTitle.csv', 'r') as readcsv:
    for row in readcsv.readlines():
        try:
            openitem = urllib2.urlopen(row).read()
            soup = BeautifulSoup(openitem, 'lxml')
            print soup.head.find('title').get_text()

        except urllib2.URLError:
            print 'passed'
            pass

我得到以下结果:

(一):

passed
贝贝网京外裁员10%:团队要保持狼性和危机感_新浪财经_新浪网
垂直电商贝贝网被曝裁员 回应称只是10%人员优化_新浪财经_新浪网

(b):

passed
Traceback (most recent call last):
  File "C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py", line 10, in 
<module>
    print soup.head.find('title').get_text()
AttributeError: 'NoneType' object has no attribute 'find'

(c):

passed
贝贝网京外裁员10%:团队要保持狼性和危机感_新浪财经_新浪网
Traceback (most recent call last):
  File "C:/Users/Rachael/PycharmProjects/untitled1/GetTitle.py", line 10, in <module>
    print soup.head.find('title').get_text()
AttributeError: 'NoneType' object has no attribute 'find'

我随机得到这三种结果

如果改为soup.title或soup.title.text或soup.title.string,它将返回相同/类似的错误

请帮帮我

我发现这很难描述,所以如果这是一个dup在任何方面,请给我类似的职位链接

谢谢


Tags: textinimportgettitlefindurllib2head
1条回答
网友
1楼 · 发布于 2024-03-29 12:22:59

'NoneType' object has no attribute此对象没有结果时会发生错误,请尝试只打印print soup.head.find('title')标题而不打印.text它应该返回类似“[]”或“None”的内容
答案:没有实际的标题标签或者文件中的某个站点上有某种类型的机器人保护

相关问题 更多 >