在python中解码包含ascii和非ascii字符的句子

2024-10-05 14:24:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据帧包含许多句子,包含许多ascii字符,没有ascii字符串,我想解码所有的句子,但有时我会遇到一些问题来完成我的工作

我用.encode("iso-8859-1").decode("utf-8")读了一些句子,但当我一步一步地读时,另一个句子显示了错误信息

sent ='æ\xad\x90洲股市:ä¼\x81æ¥\xadæ¥\xad績帶動主è¦\x81股指大幅震盪,普é\x81\x8d關注利潤率'
sent.encode('iso-8859-1').decode('utf8')

sent2="KLM annule 159 vols Ã\xa0 Amsterdam en prévision d'une tempête"
sent2.encode('iso-8859-1').decode('utf-8')

sent2
"KLM annule 159 vols à Amsterdam en prévision d'une tempête"

Tags: asciiisoutf句子encodesentendecode