刮擦react.js公司干废料网页

2024-09-27 23:21:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我无法抓取用编程的主页http://www.jobs.chreact.js公司. 我想在搜索框中输入Business,然后执行搜索。 Dryscrape的另一个例子react.js公司第页。在

我如何在这个搜索字段中写出Business?在

执行脚本时的错误消息:

ubuntu@ubuntu:~/scripts$ python jobs.py
Traceback (most recent call last):
  File "jobs.py", line 30, in <module>
    name.set("Business")
AttributeError: 'NoneType' object has no attribute 'set'

这是我的剧本:

^{pr2}$

Tags: pyhttpubuntuwww编程jsjobs公司
1条回答
网友
1楼 · 发布于 2024-09-27 23:21:13

我认为您的xpath存在问题,但除此之外,您的会话本身配置不正确。在

这条线

session = dryscrape.Session(base_url = root_url)

将URL的基设置为您的root_url,因此当您session.visit('http://www.jobs.ch/en/vacancies/')时,实际上是在访问根URL和中提供的URL的连接会议。访问. 在

如果您print session.url(),您将能够看到您实际访问的URL是http://www.jobs.ch/en/vacancies/http://www.jobs.ch/en/vacancies/

我从Chrome->;Inspect->;Right Click->;Copy xpath得到的页面的xpath是//*[@id="react-root"]/div/div[1]/div/div[2]/div/div[3]/div[2]/div/div/div/div/div[2]/div/div[1]/div/input

请验证您使用的xpath是否正确。在

相关问题 更多 >

    热门问题