Java中字符串类的成员使用了哪种utf8编码?
String
类有一个构造函数:
new String(byte[] bytes, Charset charset)
以及一种方法:
byte[] getBytes(Charset charset)
鉴于我对我的charset
的定义如下:
Charset charset = Charset.forName("UTF-8");
我实际上会使用什么样的编码?更具体地说,它是标准UTF-8(如RFC 3629)、还是CESU-8、还是Modified UTF-8中所述?(另见相应的Wikipedia article)
如果不是标准的UTF-8,是否有允许utf8中的字符串操作的库
这些UTF-8派生编码的转换器非常受欢迎
# 1 楼答案
http://download-llnw.oracle.com/javase/6/docs/api/java/nio/charset/Charset.html