我如何在链接上提取文本的一部分?硒与Python

2024-10-01 22:44:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我是硒和Python的新手。我想从他的链接中提取IMDB Film ID,例如:https://www.imdb.com/title/tt6423886/

我只需要这个:tt6423886

问题是我可以用selenium find element link获得链接,但是我不知道如何只获取tt6423886。你知道吗

from selenium import webdriver
driver = webdriver.Chrome ('chromedriver.exe')
driver.get ('cinecalidad.to/espana/')
pelicula_1 = driver.find_element_by_css_selector('body:nth-child(2) div:nth-child(1) div:nth-child(3) div:nth-child(1) > div.home_post_cont.post_box:nth-child(1)')
pelicula_1.click()
numid = driver.find_element_by_css_selector('div.single_left:nth-child(5) tbody:nth-child(1) tr:nth-child(1) td:nth-child(2) div:nth-child(4) > a:nth-child(3)')

有人能帮我吗?你知道吗


Tags: divchildby链接driverseleniumelementfind
1条回答
网友
1楼 · 发布于 2024-10-01 22:44:03

要从链接https://www.imdb.com/title/tt6423886/提取IMDB Film ID,可以使用Python的^{}方法,如下所示:

  • 代码块:

    print("Page URL is : %s" %driver.current_url)
    url = driver.current_url
    url_parts = url.split("/")
    print("The part I wanted was : %s" %url_parts[4])
    driver.quit()
    
  • 控制台输出:

    Page URL is : https://www.imdb.com/title/tt6423886/
    The part I wanted was : tt6423886
    

相关问题 更多 >

    热门问题