无法获取表lxml python的文本内容

2024-10-05 12:36:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着将lotery的结果作废,最终目标是从lotery上的5位数中得到最常见的3位数。我使用lxml和python来获取数字,但是我无法打印实际的数字,o获取xpath并尝试使用/text(),但由于某些原因,我一直得到一个空列表。这就是我用来取号码的。有什么建议吗?对不起,英语不好。在

from lxml import html
import requests

page=requests.get('http://www.loteriadecordoba.com.ar/juegos/index/Loter%C3%ADa+de+C%C3%B3rdoba-18.html')

tree = html.fromstring(page.text)

numero= tree.xpath('/html/body/div[3]/div[1]/div/div[1]/div[1]/div/div[4]/div/div/table/tbody/tr[3]/td/table/tbody/tr[2]/td[3]/text()')

print numero

我又读了几遍,最后写了这个

^{pr2}$

我使用pyQt4来呈现页面,使用它来读取数字,它在一个单独的页面上完美地工作,但是当我在for循环中运行它时,它会不断地崩溃并发布错误

^{3}$

现在我真的不知道:(。有人能给个主意吗?在


Tags: textimportdivtreehtmlpagetable数字
1条回答
网友
1楼 · 发布于 2024-10-05 12:36:40

该页面的抽奖结果内容不在静态HTML中,而是通过Javascript(我认为是JQuery)动态生成/检索的。因此,您将无法使用静态HTML解析器(如lxml.html)从页面中删除e数字。在

搜索其他方法,也许Selenium可能有用。在

相关问题 更多 >

    热门问题