import requests
from bs4 import BeautifulSoup
url=("http://finance.naver.com/news/mainnews.nhn")
r=requests.get(url)
soup=BeautifulSoup(r.content)
a_data = soup.find_all("li",{"class":"block1"})
for item in a_data:
print item.contents[0].find_all("dt",{"class":"articleSubject"})[0].text
在这段代码中,当我运行这段代码时。我有这样的错误。 “AttributeError:”NavigableString“对象没有属性”find“all”
我怎样才能解决这个问题???? 我已经试过试除法了。但是,它不起作用。。。
//Html代码
<li class="block1">
<dl>
<dt class="articleSubject">
<span class="remark"></span> <!-- 말머리는 span class="remark" 로 묶임 -->
<a href="/news/news_read.nhn?
article_id=0003289339&office_id=009&mode=mainnews&type=&date=2014-08-
27&page=1">**시총 9조 `모바일 공룡` 다음카카오 합병 승인…업계 지각변동 예고**</a>
</dt>
<dd class="articleSummary">
다음카카오가 합병을 위한 마지막 문턱을 넘어섰다. 네이버의 독주가 지속되고 있는 온라인·모바일 업계에
적지 않은 시장 판도 변화가 예상된다. 27일 다음과 카카오는 각각 제주 ..
<span class="press">매일경제 </span>
<span class="bar">|</span>
<span class="wdate">2014-08-27 11:40:05</span>
</dd>
</dl>
</li>
如果您试图找到与具有
class
属性articleSubject
的dt
相关联的文本,则可以直接在item
中找到它。这样做:
这张照片:
对于上面的HTML。如果对代码中的URL运行此代码,将得到20个结果。
item.contents
是以\n
为第一项的列表。所以在新行字符上执行find_all()
会抛出AttributeError
我会在你的圈子里把导航和标签分开。首先:
然后在循环中测试汤中的所有元素,以查看它们是否是标记或NavigableStrings,方法是:
相关问题 更多 >
编程相关推荐