Python将结果打印为“7\xe6\x9c\x810\xe6\x97\xa5”,但我想要“7月10 daily”

2024-09-30 12:24:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我获取了一个包含日语的网页,但是当我把它打印到控制台时,我没有得到输出为7月10日。相反,它会打印:7\xe6\x9c\x8810\xe6\x97\xa5

我该怎么办?在


Tags: 网页xe6x97xa5x9cx8810
1条回答
网友
1楼 · 发布于 2024-09-30 12:24:50

你得到的输出是正确的。这是日本字符串的UTF-8表示。问题是控制台本身不理解UTF-8。如果您将该字符串写入一个文件,并使用一个能够理解UTF-8的编辑器打开它,您将看到您所期望的内容。您还可以尝试将控制台的编码改为UTF-8。在

您还可以尝试编辑:

print '7\xe6\x9c\x8810\xe6\x97\xa5'.decode('utf-8')

但这是否有效取决于控制台编码是否支持日语字符。例如,如果控制台的编码是“ISO-Latin-1”,那么它将无法工作。。。在

我建议你读:http://www.joelonsoftware.com/articles/Unicode.html

相关问题 更多 >

    热门问题