更新时钟碎片

2024-10-01 05:06:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从一个网站上搜集一些数据。我似乎无法在这个页面上找到日期(时钟),因为(我认为)它是通过一个函数不断更新的,xpath似乎不起作用。你知道吗

有关页面是: http://www.tariffa.it/adsl/infostrada-easy-internet/ 我试图获取的元素的xpath是: //*[(@id=“clock”)]

我尝试用R和Python来实现这一点,但两者都不起作用。如果你对如何获取这些数据有什么建议,我将万分感激。你知道吗

谢谢。(我将发布我在R中使用的代码,我知道它可以工作,因为其余的数据正在被很好地擦除)

url = "http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1 <- htmlParse(url)
exp_date <- xpathSApply(doc1, '//*[(@id = "clock")]', saveXML)

Tags: 数据idhttpurlwwweasydoc1it