我正在尝试自动处理诸如Investing.com Economic Calendar之类的网页表格 如果我们只对显示今天的日历的默认选项卡感兴趣,那么R就相当简单了。以下是R代码:
library(rvest)
library(dplyr)
Econ_webpage <- read_html("https://www.investing.com/economic-calendar/")
Indicators <- Econ_webpage %>% html_nodes("#economicCalendarData") %>%
html_table(fill = TRUE) %>% .[[1]] %>% .[-(1:3),- c(match("Imp.",colnames(.)),ncol(.))]
这将产生下面显示的所需结果。在
^{pr2}$但是,如果我想明天在tab中清除表,我需要使用Selenium驱动程序。我尝试过RSelenium,但无法在我的机器上运行,所以我尝试了Python中的Selenium。我在Python中使用以下代码:
import selenium
from selenium import webdriver
driver.Chrome(executable_path=PATH_TO_CHROMEDRIVER)
driver.get("https://www.investing.com/economic-calendar/")
driver.find_element_by_id("timeFrame_tomorrow").click()
html = driver.page_source
现在我有了一个包含所需表数据的html字符串,我只是不知道如何有效地par生成R代码的结果。我可以调用rpy2包吗?rpy2包允许Python中的R代码,或者其他人知道一种更简单的方法来提取与上面相同的表?如何解析这个html字符串?在
如果
RSelenium
在R
中,我们可以试试相关问题 更多 >
编程相关推荐