我需要帮助刮单词“cpcadverising.com”在突出显示的span标签(见附加的HTML屏幕截图)。我不确定如何正确地迭代。到目前为止,我掌握的情况如下:
import requests
from bs4 import BeautifulSoup
page_number = 1
flippa_page = requests.get('https://www.flippa.com/search?filter[property_type]=domain&filter[status]=won&filter[sale_method]=auction&page[number]={}&page[size]=250'.format(page_number))
price_list = []
domain_list = []
for i in range(120):
src = flippa_page.content
soup = BeautifulSoup(src, 'lxml')
for span_tag in soup.find_all('span'):
domain_list.append(span_tag.attrs['class'])
page_number += 1
使用html.parser而不是lxml,我可以找到span标记:
由于某种原因,我无法用lxml进行解析,如果您能告诉我您使用的lxml库是什么,我可以用它进行检查
因为你的网址不适合我,我用的是同一个网站的不同网址。无论如何,您可以在
find_all()
命令中指定类,如下所示:单词应该在
span_tag.string
中相关问题 更多 >
编程相关推荐