擅长:python、mysql、java
<p>您的XPath表达式与任何内容都不匹配,因为您尝试擦除的HTML页面严重损坏。FF(或任何其他web浏览器)会在移动中修复页面,然后再显示它。这将导致添加HTML标记,而这些标记在原始文档中不存在。在</p>
<p>下面的代码包含一个XPath表达式,它很可能会为您指明正确的方向。在</p>
<pre><code>import requests
from lxml import html, etree
sample_page = requests.get("https://www.racenet.com.au/horse-racing-results/happy-valley/2016-11-16")
tree = html.fromstring(sample_page.content)
nodes = tree.xpath("//*[@id='resultsListContainer']/div/table[@class='tblLatestHorseResults']/tr[@class='raceDetails']/td/span[1]")
for node in nodes:
print etree.tostring(node)
</code></pre>
<p>执行时,将打印以下内容:</p>
^{pr2}$
<p>小贴士:每当你试图抓取一个网页,但事情没有如预期的那样工作,下载HTML并保存到一个文件中。在这种情况下,例如:</p>
^{3}$
<p>然后看看保存的HTML。这将使您了解DOM的外观。在</p>