转换奇怪的数据类型

1条回答

网友

1楼 · 发布于 2024-09-29 22:34:08

使用repr，而不是str。它应该总是，总是工作的（除非API本身被破坏了，而这正是抛出错误的地方）。你知道吗

默认情况下，在python2中将Unicode字符串转换为byte str（反之亦然）时，转换过程将默认使用ascii编码。这在大多数情况下都有效，但并不总是有效。因此，像这样令人讨厌的边缘案件是一种痛苦。Python3中向后兼容性中断的一个重要原因是改变了这种行为。你知道吗

使用latin1进行测试。它可能不是正确的编码，但它将始终（总是，总是，总是）工作，并为您提供一个正确调试的起点，这样您至少可以打印一些东西。你知道吗

trends = twitter.Api.GetTrendsCurrent(api)
print type(trends)
print unicode(trends)
print unicode(trends).encode('latin1')

或者，更好的是，当编码强制它忽略或替换错误时：

trends = twitter.Api.GetTrendsCurrent(api)
print type(trends)
print unicode(trends)
print unicode(trends).encode('utf8', 'xmlcharrefreplace')

很有可能，因为您处理的是基于web的API，所以您处理的是UTF-8数据；它几乎是web上所有的默认编码。你知道吗