html java utf8加密问题 1 周,5 日 Questions & Answers 406 我正在使用一个名为HTMLCLEANER的HTML解析器来解析HTML页面 问题是每个页面的编码都不同于另一个页面。 我的问题 我可以从任何字符编码更改为UTF-8吗
# 1 楼答案 您从哪里获得HTML页面?如果您从servlet请求获得它,那么可以对其使用getReader()并将其传递给^{}。这将使用正确的编码。如果您是通过上传获得的,请将输入流传递给clean()。如果您是通过http客户机获取的,则需要使用^{}检查响应头Content-Type
# 2 楼答案 Can i change from any character encoding to UTF-8? 是的,您可以用UTF-8编码表示任何Unicode字符 更改HTML页面的编码时可能会出现问题:例如,如果页面包含“charset”元标记 <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> 您必须更新此标记,使其与实际编码相对应
# 4 楼答案 public void arreglarString(String cadena) { for (int i = 161; i < 256; i++) { char car = (char) i; cadena = cadena.replaceAll(car + "", "&#" + i); } return cadena; }
# 1 楼答案
您从哪里获得HTML页面?如果您从servlet请求获得它,那么可以对其使用getReader()并将其传递给^{} 。这将使用正确的编码。如果您是通过上传获得的,请将输入流传递给} 检查响应头
clean()
。如果您是通过http客户机获取的,则需要使用^{Content-Type
# 2 楼答案
是的,您可以用UTF-8编码表示任何Unicode字符
更改HTML页面的编码时可能会出现问题:例如,如果页面包含“charset”元标记
您必须更新此标记,使其与实际编码相对应
# 3 楼答案
如果事先不知道编码X,就无法从编码X无缝地“转换”到编码Y。只需检查HTTP响应头使用的编码(如果您是通过HTTP获取这些HTML页面),然后在HTML解析器工具中使用适当的编码
# 4 楼答案