如何让python循环遍历url数组，并在csv中每行写入数据？

# -*- coding: utf-8 -*- import urllib2 from bs4 import BeautifulSoup import csv from datetime import datetime quote_page = ['http://uk.mobile.reuters.com/business/quotes/overview/AALB.AS', 'http://uk.mobile.reuters.com/business/stocks/overview/ABNd.AS', 'http ://uk.mobile.reuters.com/business/stocks/overview/ACCG.AS', 'http ://uk.mobile.reuters.com/business/stocks/overview/AD.AS'] for link in quote_page: try: page = urllib2.urlopen(link) soup = BeautifulSoup(page, 'html.parser') name_box = soup.find('span', attrs={'class': 'company-name'}) name = name_box.text.strip() print name price_box = soup.find('span', attrs={'class':'price'}) price = price_box.text.strip() print price recrating_box = soup.find('div', attrs={'class':'recommendation-rating'}) recrat = recrating_box.text.strip() print recrat opinion = soup.find('div', attrs={'class':'recommendation-marker'})['style'] print opinion except TypeError: continue quote_page.append((name, price, recrat, opinion)) # open a csv file with append, so old data will not be erased with open('index.csv', 'a') as csv_file: writer = csv.writer(csv_file) for name, price in quote_page: writer.writerows([name, price, recrat, opinion, datetime.now()])

1条回答

网友

1楼 · 发布于 2024-10-03 02:41:36

测试和工作：

# -*- coding: utf-8 -*-
import urllib2
from bs4 import BeautifulSoup
import csv
from datetime import datetime

quote_page = ['http://uk.mobile.reuters.com/business/quotes/overview/AALB.AS',
   'http://uk.mobile.reuters.com/business/stocks/overview/ABNd.AS',
   'http://uk.mobile.reuters.com/business/stocks/overview/ACCG.AS', 
   'http://uk.mobile.reuters.com/business/stocks/overview/AD.AS']

results = []

for link in quote_page:
    try:
        page = urllib2.urlopen(link)
        soup = BeautifulSoup(page, 'html.parser')

        name_box = soup.find('span', attrs={'class': 'company-name'})
        name = name_box.text.strip()
        print name

        price_box = soup.find('span', attrs={'class':'price'})
        price = price_box.text.strip()
        print price

        recrating_box = soup.find('div', attrs={'class':'recommendation-rating'})
        recrat = recrating_box.text.strip()
        print recrat

        opinion = soup.find('div', attrs={'class':'recommendation-marker'})['style']
        print opinion
    except TypeError:
        continue

    results.append((name, price, recrat, opinion))   

# open a csv file with append, so old data will not be erased
with open('index.csv', 'w') as csv_file:
    writer = csv.writer(csv_file)
    for item in results:
        writer.writerow([item[0], item[1], item[2], item[3], datetime.now()])

有3个问题，首先，您重写了一个活动列表-不是一个好主意：我将其重命名为results。在

第二，您试图遍历列表，但只访问了4项中的2项。我已经做了索引。在

最后，当您迭代时，您需要逐行执行，因此writerows需要更改为writerow。在

相关问题更多 >

编程相关推荐

热门问题

热门文章