提交表单以从作业板中刮取数据

import requests url='https://caterpillar.taleo.net/careersection/cat+external+cs/jobsearch.ftl?lang=en&portal=4140124208&src=CWS-10005' r = requests.post(url, data={'dropListSize': 100}) print(r.status_code, r.reason) html=r.text

1条回答

网友

1楼 · 发布于 2024-10-02 02:39:10

有一个XHR POST请求发送到https://caterpillar.taleo.net/careersection/cat+external+cs/jobsearch.ajax端点，该端点包含响应中的所有搜索结果。您可以尝试模拟它（从参数数量和响应格式来看，我怀疑这不会很有趣），或者您可以通过^{}在真实浏览器中加载页面，让浏览器加载页面，而不必担心搜索结果如何传递

使用selenium+^{}无头浏览器的工作示例：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


url = 'https://caterpillar.taleo.net/careersection/cat+external+cs/jobsearch.ftl?lang=en&portal=4140124208&src=CWS-10005'
driver = webdriver.PhantomJS()
driver.get(url)

wait = WebDriverWait(driver, 10)
table = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "table.contentlist")))

for row in table.find_elements_by_css_selector("tr.ftlrow"):
    title = row.find_element_by_css_selector(".titlelink a").text
    print(title)

driver.close()

印刷品：

Sales accountant
Manufacturing Project Engineer
Staff Accountant - Accountable
Hydraulic Cylinder Design Engineer
Engineering Supervisor(Hydraulic Cylinder)
Design Engineer
Senior Design Engineer
Senior Engineer
Senior Design Engineer
Dealer Solution Network (DSN) Analyst

相关问题更多 >

编程相关推荐

热门问题

热门文章

提交表单以从作业板中刮取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >