有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

html java utf8加密问题

我正在使用一个名为HTMLCLEANER的HTML解析器来解析HTML页面 问题是每个页面的编码都不同于另一个页面。 我的问题

我可以从任何字符编码更改为UTF-8吗


共 (4) 个答案

  1. # 1 楼答案

    您从哪里获得HTML页面?如果您从servlet请求获得它,那么可以对其使用getReader()并将其传递给^{}。这将使用正确的编码。如果您是通过上传获得的,请将输入流传递给clean()。如果您是通过http客户机获取的,则需要使用^{}检查响应头Content-Type

  2. # 2 楼答案

    Can i change from any character encoding to UTF-8?

    是的,您可以用UTF-8编码表示任何Unicode字符

    更改HTML页面的编码时可能会出现问题:例如,如果页面包含“charset”元标记

    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
    

    您必须更新此标记,使其与实际编码相对应

  3. # 3 楼答案

    如果事先不知道编码X,就无法从编码X无缝地“转换”到编码Y。只需检查HTTP响应头使用的编码(如果您是通过HTTP获取这些HTML页面),然后在HTML解析器工具中使用适当的编码

  4. # 4 楼答案

    public void arreglarString(String cadena) {
        for (int i = 161; i < 256; i++) {
            char car =  (char) i;
            cadena = cadena.replaceAll(car + "", "&#" + i); 
        }
    
        return cadena;
    }