通过Python、Selenium和Beautiful Soup扩展DOM列表以提取其他内容

2条回答

网友

1楼 · 编辑于 2024-05-19 05:07:42

没有得到输出可能有多种原因

a）您单击了错误的元素

b）在单击元素之前，您不会等待它被加载

c）您不是在等待单击元素后加载内容

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Chrome('/path/to/chromedriver')
url="https://app.updateimpact.com/treeof/org.apache.commons/commons-lang3/3.7"
driver.get(url)
element=WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH ,'//*[@id="org.apache.commons:commons-lang3:3.7:jar_anchor"]/span')))
element.click()
element=WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH ,'//*[@id="tree-detail"]/div[2]/span[1]')))
print(driver.find_element_by_xpath('//*[@id="detail_div"]').text)

输出

org.apache.commons:commons-lang3:3.7:jar (back)
Project module (browse only dependencies of this module)
Group id org.apache.commons
Artifact id commons-lang3
Version 3.7
Type jar
This dependency isn't a dependency of any other dependencies.

网友

2楼 · 编辑于 2024-05-19 05:07:42

您可以使用requests包以json的形式获取所有信息。下面是如何从page获取所有信息的示例：

import requests

if __name__ == '__main__':
    url = "https://app.updateimpact.com/api/singleArtifact?artifactId=commons-lang3&groupId=org.apache.commons&version=3.7"

    req_params = requests.get(url).json()
    response = requests.get(
        'https://app.updateimpact.com/api/builds/%s/%s' % (req_params["userIdStr"], req_params["buildId"]))
    print(response.json())

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过Python、Selenium和Beautiful Soup扩展DOM列表以提取其他内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >