ScraperWiki数据存储需要什么编码?

2024-06-26 01:37:08 发布

您现在位置:Python中文网/ 问答频道 /正文

ScraperWiki上编写scraper时,我在试图保存UTF8编码的字符串时反复收到以下消息:

UnicodeDecodeError('utf8', ' the \xe2...', 49, 52, 'invalid data')

通过试用和unicodedecoderror,我最终发现ScraperWiki数据存储似乎希望使用Unicode。在

因此,我现在正在从UTF-8解码,并在保存到数据存储之前立即将所有内容转换为Unicode:

^{pr2}$

这避免了错误,但是否合理?谁能确认ScraperWiki数据存储支持什么编码?在

谢谢!在


Tags: the数据字符串消息编码dataunicodeutf8
1条回答
网友
1楼 · 发布于 2024-06-26 01:37:08

数据存储需要UTF-8字节字符串或Unicode字符串。在

此示例显示了在Python中保存英镑货币符号的两种方法:

http://scraperwiki.com/scrapers/unicode_test/

其他语言也是如此。在

出于调试目的,您可以将非UTF-8/Unicode字符串打印到控制台,它不理解的字符将被剥离。在

相关问题 更多 >