Xpath只指向父变量,不指向整个pag

2024-10-01 02:36:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从表中获取数据,但遇到了一个问题,必须从特定的表数据单元中获取数据。你知道吗

#! /usr/bin/python

import urllib
from lxml import html

url="http://kforce.com/Jobs/Search.aspx?Location=&Specialty=Technology-Jobs&Keyword="

pageHtml = html.fromstring(urllib.urlopen(url).read())

#id="Body_SearchResultsControl_grdJobs"

#row class jobResultsAlternateRow || jobResultsRowStyle

jobs = pageHtml.xpath("//table[@id='Body_SearchResultsControl_grdJobs']/tr[@class='jobResultsAlternateRow' or @class='jobResultsRowStyle']");

for i in jobs:
        cols = i.getchildren() #get all table data cells
        print(cols[0].xpath('//a/@href'))
        exit(0)

xpath应用于页面上的所有链接,而不仅仅是我分配给它的列。我不太熟悉XPath,但我不确定它是XPath查询还是我使用的XPath查询。你知道吗


Tags: importidurlhtmljobsbodyurllibxpath
1条回答
网友
1楼 · 发布于 2024-10-01 02:36:50

如果要在元素而不是根中开始搜索,则应使用.//

print(cols[0].xpath('.//a/@href'))

打印['Job.aspx?job=1696~EQG~1259184T1~99&keyword=']-我想这就是你想要的。你知道吗

希望有帮助。你知道吗

相关问题 更多 >