from selenium import webdriver
driver = webdriver.Firefox()
driver.get("http://vip.stock.finance.sina.com.cn/mkt/#cyb_root")
rows = driver.find_elements_by_xpath("//div[@id='tbl_wrap']//tbody/tr")
for row in rows:
name = row.find_element_by_xpath("./th[@class='sort_down']/a").text
values = [v.text for v in row.find_elements_by_xpath("./td[@class='colorize']")]
print "%s : %s" % (name, values)
driver.close()
您可以使用http://docs.python-requests.org/en/latest/或http://doc.scrapy.org/en/0.16/。在
如果你想跟踪大量的链接或者你需要抓取不同类型的对象。我强烈建议刮痧。如果你需要一个你的网站的例子让我知道,这两个库都是非常简单的使用。在
我试过你的网站,在你的例子中,用一个像selenium这样的浏览器自动化工具来做爬虫比较简单,这里是新浪网公司名称:
如果运行此脚本,将获得:
^{pr2}$:)祝你好运
相关问题 更多 >
编程相关推荐