如何从网页中提取源html？

2条回答

网友

1楼 · 编辑于 2024-05-07 05:16:07

使用Jsoup可以很容易地提取主表

下面是一个方法，它将从页面的主表中获取所有内容

public void parse(){
        try{

        Document doc = Jsoup.connect("http://www.fxstreet.com/rates-charts/currency-rates/").get();
        Element content = doc.getElementById("ddlPairsChoose");
        Elements table = doc.getElementsByClass("applet-content");      

        System.out.print(table);

        }

        catch(Exception e){

            System.out.print("error  > " + e);
        }       
    }

它打印出页面上的表格

网友

2楼 · 编辑于 2024-05-07 05:16:07

尝试使用HtmlUnit并设置setJavascriptEnabled(true)

另请看：this和this

JSoup不是执行Javascript的无头浏览器，因此必须选择其他库来获取页面，然后才能使用JSoup解析它。在

编程相关推荐

java从不同类调用方法
java Jersey 2+Jackson注释/@JsonIgnore
java Tomcat未启动，但出现错误
JdbcTemplate batchUpdate的java问题
java如何检查时间是否存在？
java如何扩展ActionBarActivity和ListActivity？
java是由：org引起的。springframework。数据雷迪斯。序列化程序。SerializationException:无法反序列化；嵌套的异常是org。springframework。果心连载
trycatch块中的java递归调用以重试N次
java为什么我可以从getClass（）获取有效的url。getResource（），但返回的url创建了一个不存在的文件
java通过google cloud run部署pub/sub-spring应用程序

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从网页中提取源html？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >