有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java为什么用Jsoup解析后内容不一样

我正在尝试使用JSOUP解析thisurl。当我解析thisurl时,我得到的解析文档类似于unicode格式,而不是实际数据。url根据需要为我提供正确的印地语文本。我使用下面的代码来解析URl。顺便说一句,url是在我的网站上托管的。服务器上的文本文件有问题吗?我想不出这一点

    Document doc = Jsoup
            .connect(
                    "hindi-stories.kratav.com/content/social_aalha.html")
            .userAgent("Mozilla").timeout(15 * 1000).get(); 

共 (1) 个答案

  1. # 1 楼答案

    我检查了第一个URL的源代码,没有指定编码。而第二个有一个元:

    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    

    尝试使用指定字符集的方法解析第一个URL,即:

    Document document = Jsoup.parse(new URL(url).openStream(), "UTF-16", url);