带多变量的Python scrape

import urllib2 from bs4 import BeautifulSoup import csv from datetime import datetime quote_page = ['https://ycharts.com/companies/AAPL/dividend_yield', 'https://ycharts.com/companies/T/dividend_yield', 'https://ycharts.com/companies/MMM/dividend_yield'] data = [] for pg in quote_page: page = urllib2.urlopen(pg) soup = BeautifulSoup(page, 'html.parser') divyield_box = soup.find('td', attrs={'class': 'col2'}) divyield = divyield_box.text.strip() data.append((divyield)) with open('index.csv', 'a') as csv_file: writer = csv.writer(csv_file) for divyield in data: writer.writerow([divyield, datetime.now()])

1条回答

网友

1楼 · 发布于 2024-10-16 22:24:53

试试简化的_scrapy解决方案

from simplified_scrapy.request import req
from simplified_scrapy.simplified_doc import SimplifiedDoc
quote_page = ['https://ycharts.com/companies/AAPL/dividend_yield', 'https://ycharts.com/companies/T/dividend_yield', 'https://ycharts.com/companies/MMM/dividend_yield']

data = []
for pg in quote_page:
  page = req.get(pg)
  doc = SimplifiedDoc(page)
  divyield = doc.getElement('td',attr='class',value='col2').text
  # divyield = doc.select('td.col2>text()')
  data.append((divyield))
print (data)

结果:

[u'0.95%', u'5.34%', u'3.18%']

下面是简化的{a1}的更多示例

相关问题更多 >

编程相关推荐

热门问题

热门文章