使用Selenium（Python3）对网站的多个页面进行爬网

RegionIDArray = ['de/7132/New-York-City/d687-allthingstodo', 'de/7132/London/d737-allthingstodo'] class Crawling(unittest.TestCase): def setUp(self): self.driver = webdriver.Firefox() self.driver.set_window_size(10, 10) self.base_url = "http://www.jsox.de/" self.accept_next_alert = True def test_sel(self): driver = self.driver delay = 3 for reg in RegionIDArray: page = 0 driver.get(self.base_url + str(reg)) for i in range(1,4): driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") time.sleep(2)

2条回答

网友

1楼 · 编辑于 2024-10-02 02:26:56

Python循环由缩进控制。在

for i in range(1,4):
             driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
             time.sleep(2)

网友

2楼 · 编辑于 2024-10-02 02:26:56

你的for循环

for reg in RegionIDArray:
    page = 0

将循环遍历所有列表项，当它退出时，reg指向最后一项，即伦敦。所以你只能拿到最后一件

相反，您只需要将driver部分放入for循环中

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章