Selenium中的多线程/多处理

https://news.ycombinator.com/user?id=ingve https://news.ycombinator.com/user?id=dehrmann https://news.ycombinator.com/user?id=thanhhaimai https://news.ycombinator.com/user?id=rbanffy https://news.ycombinator.com/user?id=raidicy https://news.ycombinator.com/user?id=svenfaw https://news.ycombinator.com/user?id=ricardomcgowan

from selenium import webdriver driver = webdriver.Chrome() input1 = open("HNlinks.txt", "r") urls1 = input1.readlines() for url in urls1: driver.get(url) links=driver.find_elements_by_class_name('athing') for link in links: print(link.find_element_by_css_selector('a').get_attribute("href"))

1条回答

网友

1楼 · 发布于 2024-10-03 19:27:34

使用多处理*

注意：我没有在本地测试这个答案。请尝试并给出反馈：

from multiprocessing import Pool
from selenium import webdriver

input1 = open("HNlinks.txt", "r")
urls1 = input1.readlines()

def load_url(url):
    driver = webdriver.Chrome()
    driver.get(url)
    links=driver.find_elements_by_class_name('athing')
    for link in links:
        print(link.find_element_by_css_selector('a').get_attribute("href"))

if __name__ == "__main__":
    # how many concurrent processes do you want to span? this is also limited by 
    the number of cores that your computer has.
    processes = len(urls1)
    p = Pool(processes ) 
    p.map(load_url, urls1)
    p.close()
    p.join()

使用多处理*

相关问题更多 >

编程相关推荐

热门问题

热门文章