用Python或R读取动态网页html

library(rvest) library(dplyr) Econ_webpage <- read_html("https://www.investing.com/economic-calendar/") Indicators <- Econ_webpage %>% html_nodes("#economicCalendarData") %>% html_table(fill = TRUE) %>% .[[1]] %>% .[-(1:3),- c(match("Imp.",colnames(.)),ncol(.))]

import selenium from selenium import webdriver driver.Chrome(executable_path=PATH_TO_CHROMEDRIVER) driver.get("https://www.investing.com/economic-calendar/") driver.find_element_by_id("timeFrame_tomorrow").click() html = driver.page_source

1条回答

网友

1楼 · 发布于 2024-06-01 12:39:21

如果RSelenium在R中，我们可以试试

library(RSelenium)
library(XML)

rD <- rsDriver()
remDr <- rD[["client"]]
remDr$navigate("https://www.investing.com/economic-calendar/")
option <- remDr$findElement("id", "timeFrame_tomorrow")
option$clickElement()
res <- readHTMLTable((remDr$getPageSource()[[1]]))$economicCalendarData
res <- res[-1,]
head(res)
#   Time Cur. Imp.                       Event Actual Forecast Previous 
#2 02:30  GBP      Investing.com GBP/USD Index                    46.5% 
#3 02:30  USD         Investing.com Gold Index                    65.6% 
#4 02:30  USD      Investing.com S&P 500 Index                    70.7% 
#5 02:30  CAD      Investing.com USD/CAD Index                    41.8% 
#6 02:30  CHF      Investing.com USD/CHF Index                    53.8% 
#7 02:30  AUD      Investing.com AUD/USD Index                    47.9% 


remDr$close()
rD[["server"]]$stop()

相关问题更多 >

编程相关推荐

热门问题

热门文章