尝试使用BeautifulSoup和CSV Wri迭代网站页面的逻辑流问题的回答

尝试使用BeautifulSoup和CSV Wri迭代网站页面的逻辑流

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

<p>我似乎无法找出正确的缩进/子句位置，以使此循环超过一页。这段代码可以很好地打印CSV文件，但只打印第一页。你知道吗</p> <pre><code>#THIS WORKS BUT ONLY PRINTS THE FIRST PAGE from bs4 import BeautifulSoup from urllib2 import urlopen import csv page_num = 1 total_pages = 20 with open("MegaMillions.tsv","w") as f: fieldnames = ['date', 'numbers', 'moneyball'] writer = csv.writer(f, delimiter = '\t') writer.writerow(fieldnames) while page_num < total_pages: page_num = str(page_num) soup = BeautifulSoup(urlopen('http://www.usamega.com/mega-millions-history.asp?p='+page_num).read()) for row in soup('table',{'bgcolor':'white'})[0].findAll('tr'): tds = row('td') if tds[1].a is not None: date = tds[1].a.string.encode("utf-8") if tds[3].b is not None: uglynumber = tds[3].b.string.split() betternumber = [int(uglynumber[i]) for i in range(len(uglynumber)) if i%2==0] moneyball = tds[3].strong.string.encode("utf-8") writer.writerow([date, betternumber, moneyball]) page_num = int(page_num) page_num += 1 print 'We\'re done here.' </code></pre> <p>当然，这只打印最后一页：</p> <pre><code>#THIS WORKS BUT ONLY PRINTS THE LAST PAGE from bs4 import BeautifulSoup from urllib2 import urlopen import csv page_num = 1 total_pages = 20 while page_num < total_pages: page_num = str(page_num) soup = BeautifulSoup(urlopen('http://www.usamega.com/mega-millions-history.asp?p='+page_num).read()) with open("MegaMillions.tsv","w") as f: fieldnames = ['date', 'numbers', 'moneyball'] writer = csv.writer(f, delimiter = '\t') writer.writerow(fieldnames) for row in soup('table',{'bgcolor':'white'})[0].findAll('tr'): tds = row('td') if tds[1].a is not None: date = tds[1].a.string.encode("utf-8") if tds[3].b is not None: uglynumber = tds[3].b.string.split() betternumber = [int(uglynumber[i]) for i in range(len(uglynumber)) if i%2==0] moneyball = tds[3].strong.string.encode("utf-8") writer.writerow([date, betternumber, moneyball]) page_num = int(page_num) page_num += 1 print 'We\'re done here.' </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

尝试使用BeautifulSoup和CSV Wri迭代网站页面的逻辑流

1 个回答

相关Python问题