使用Regex从JSON中删除字符串中的Unicode\uxxx

Traceback (most recent call last): File "eraseunicode.py", line 17, in <module> print(text) File "C:\Python27\lib\encodings\cp437.py", line 12, in encode return codecs.charmap_encode(input,errors,encoding_map) UnicodeEncodeError: 'charmap' codec can't encode character u'\u2019' in position 53: character maps to <undefined>

1条回答

网友

1楼 · 发布于 2024-10-02 20:40:04

当数据在文本文件中时，\u2019是一个字符串。但一旦加载到json中，它就变成了unicode，替换就不再起作用了。在

因此，您必须在加载到json之前应用regex，这样就可以工作了

tweet = json.loads(removeunicode(line))

当然，它处理整个原始生产线。您还可以通过检查如下字符代码从解码的text中删除非ascii字符（请注意，它不是严格等效的）：

^{pr2}$

编程相关推荐

java文件路径中的java UTF8字符
java如何可靠地写入OPC UA服务器？
for-my-if语句中的java循环不能产生我想要的结果
java我如何在1个XSL中加入2个XML
macos无法在“/Library/Java/JavaVirtualMachines/jdk15.0.1.jdk/Contents/Home/bin/apt”中找到可执行文件
Java代码简单数学
java如何避免selenium中的sendKeys方法清除之前填充的文本？
java如何将PlacesAPI自动完成小部件传递到自定义对话框？
带有文本块的java Intellij json片段问题
启动时Spring启动错误：java。木卫一。IOException:jsse。别名\u否\u键\u项

相关问题更多 >

编程相关推荐

热门问题

热门文章