AttributeError:“NavigableString”对象没有“find\u all”属性（NameError）

import requests from bs4 import BeautifulSoup url=("http://finance.naver.com/news/mainnews.nhn") r=requests.get(url) soup=BeautifulSoup(r.content) a_data = soup.find_all("li",{"class":"block1"}) for item in a_data: print item.contents[0].find_all("dt",{"class":"articleSubject"})[0].text

<li class="block1"> <dl> <dt class="articleSubject">  <a href="/news/news_read.nhn? article_id=0003289339&office_id=009&mode=mainnews&type=&date=2014-08- 27&page=1">**시총 9조 `모바일 공룡` 다음카카오 합병 승인…업계 지각변동 예고**</a> </dt> <dd class="articleSummary"> 다음카카오가 합병을 위한 마지막 문턱을 넘어섰다. 네이버의 독주가 지속되고 있는 온라인·모바일 업계에 적지 않은 시장 판도 변화가 예상된다. 27일 다음과 카카오는 각각 제주 .. 매일경제 | 2014-08-27 11:40:05 </dd> </dl> </li>

2条回答

网友

1楼 · 编辑于 2024-10-05 14:29:24

如果您试图找到与具有class属性articleSubject的dt相关联的文本，则可以直接在item中找到它。

这样做：

>>> for item in a_data:
...     print item.find_all("dt",{"class":"articleSubject"})[0].text

这张照片：

**시총 9조 `모바일 공룡` 다음카카오 합병 승인…업계 지각변동 예고**

对于上面的HTML。如果对代码中的URL运行此代码，将得到20个结果。

item.contents是以\n为第一项的列表。所以在新行字符上执行find_all()会抛出AttributeError

网友

2楼 · 编辑于 2024-10-05 14:29:24

我会在你的圈子里把导航和标签分开。首先：

import NavigableString

然后在循环中测试汤中的所有元素，以查看它们是否是标记或NavigableStrings，方法是：

if isinstance(object, NavigableString):
    Do something with this event
else:
    Do something with thing that is not NavigableString

相关问题更多 >

编程相关推荐

热门问题

热门文章