2024-09-30 12:24:50 发布
网友
我获取了一个包含日语的网页,但是当我把它打印到控制台时,我没有得到输出为7月10日。相反,它会打印:7\xe6\x9c\x8810\xe6\x97\xa5
7月10日
7\xe6\x9c\x8810\xe6\x97\xa5
我该怎么办?在
你得到的输出是正确的。这是日本字符串的UTF-8表示。问题是控制台本身不理解UTF-8。如果您将该字符串写入一个文件,并使用一个能够理解UTF-8的编辑器打开它,您将看到您所期望的内容。您还可以尝试将控制台的编码改为UTF-8。在
您还可以尝试编辑:
print '7\xe6\x9c\x8810\xe6\x97\xa5'.decode('utf-8')
但这是否有效取决于控制台编码是否支持日语字符。例如,如果控制台的编码是“ISO-Latin-1”,那么它将无法工作。。。在
我建议你读:http://www.joelonsoftware.com/articles/Unicode.html
你得到的输出是正确的。这是日本字符串的UTF-8表示。问题是控制台本身不理解UTF-8。如果您将该字符串写入一个文件,并使用一个能够理解UTF-8的编辑器打开它,您将看到您所期望的内容。您还可以尝试将控制台的编码改为UTF-8。在
您还可以尝试编辑:
但这是否有效取决于控制台编码是否支持日语字符。例如,如果控制台的编码是“ISO-Latin-1”,那么它将无法工作。。。在
我建议你读:http://www.joelonsoftware.com/articles/Unicode.html
相关问题 更多 >
编程相关推荐