因此,当我运行我的程序与任何其他一个“天空”*它会工作,但当我运行它与天空它不工作
import urllib
import re
newsymbolslist = ["NFLX", "GOOG", "VNR", "AAPL", "SKY"]
i=0
while i<len(newsymbolslist):
url = ("http://www.nasdaq.com/symbol/" +newsymbolslist[i]+ "/real-time")
htmlfile = urllib.urlopen(url)
htmltext = htmlfile.read()
regex = '<span id="quotes_content_left_OverallStockRating1_lblPercentage" class="comm_bullrating">(.+?)</span>'
pattern = re.compile(regex)
price = re.findall(pattern,htmltext)
print (newsymbolslist[i] + " is: " + price[0])
i+=1
*天空是新闻符号列表中的最后一个符号
由regex for SKY提取的信息已损坏,如下所示:
在列表上循环的一种更为python的方式是:
sky的问题是类是
comm_50rating
,而不是comm_bullrating
因为nasdaq.com不会返回包含SKY的
<span id="quotes_content_left_OverallStockRating1_lblPercentage" class="comm_bullrating">
标记的页面相关问题 更多 >
编程相关推荐