从p标记获取文本内容

<a href="http://t.co/kwtDyFn6dC" rel="nofollow" dir="ltr" data-expanded-url="http://DataMiningBlog.com" class="twitter-timeline-link" target="_blank" title="http://DataMiningBlog.com">http://DataMiningBlog.com </a> covers current challenges, interviews with leading actors and book reviews related to data mining, analytics and data science.

Traceback (most recent call last): File "twitter_user_scrapper.py", line 91, in getImageList print div.find('p', attrs={'class' : 'ProfileCard-bio u-dir'}).text AttributeError: 'NoneType' object has no attribute 'text'

1条回答

网友

1楼 · 发布于 2024-10-02 04:32:19

问题可能是某些class为ProfileCard-content的div可能没有类为ProfileCard-bio u-dir的子p元素，发生这种情况时，以下返回None-

div.find('p', attrs={'class' : ['ProfileCard-bio', 'u-dir']})

这就是你得到AttributeError的原因。您应该得到上面的返回值并将其保存在一个变量中，并检查它的None是否存在，并且只有当文本不是None时才接受文本。在

另外，你应该给类一个所有类的列表，而不是一个字符串，就像-

^{pr2}$

示例-

productDivs = soup.findAll('div', attrs={'class' : 'ProfileCard-content'})
for div in productDivs:
   elem = div.find('p', attrs={'class' : ['ProfileCard-bio', 'u-dir']})
   if elem:
       print elem.text

相关问题更多 >

编程相关推荐

热门问题

热门文章