Flipkart.com网站使用Python提取产品'price'和产品'title'

import urllib2 import bs4 import re item="Wilco Classic Library: Autobiography Of a Yogi (Hardcover)" item.replace(" ", "+") link = 'http://www.flipkart.com/search/a/all?query={0}&vertical=all&dd=0&autosuggest[as]=off&autosuggest[as-submittype]=entered&autosuggest[as-grouprank]=0&autosuggest[as-overallrank]=0&autosuggest[orig-query]=&autosuggest[as-shown]=off&Search=%C2%A0&otracker=start&_r=YSWdYULYzr4VBYklfpZRbw--&_l=pMHn9vNCOBi05LKC_PwHFQ--&ref=a2c6fadc-2e24-4412-be6a-ce02c9707310&selmitem=All+Categories'.format(item) r = urllib2.Request(link, headers={"User-Agent": "Python-urlli~"}) try: response = urllib2.urlopen(r) except: print "Internet connection error" thePage = response.read() soup = bs4.BeautifulSoup(thePage) firstBlockSoup = soup.find('div', attrs={'class': 'fk-srch-item'}) priceSoup=firstBlockSoup.find('b',attrs={'class':'fksd-bodytext price final-price'}) price=priceSoup.contents[0] print price titleSoup=firstBlockSoup.find('a',attrs={'class':'fk-srch-title-text fksd-bodytext'}) title=titleSoup.findAll('b') print title

2条回答

网友
1楼 · 编辑于 2024-10-06 13:22:40

从firstBlockSoup标记获取标题会更容易：
>>> firstBlockSoup.attrs['data-item-name'] 'Wilco Classic Library: Autobiography Of a Yogi (Hardcover)'

网友
2楼 · 编辑于 2024-10-06 13:22:40

只需对titleSoup使用text方法
>>> titleSoup=firstBlockSoup.find('a',attrs={'class':'fk-srch-title-text fksd-bodytext'}) >>> titleSoup.text u'Wilco Classic Library: Autobiography Of a Yogi (Hardcover)'
这也将起作用：
^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章