"Python Spark笔记中有错误字符á é í ñ"

2024-10-03 06:18:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在加载一些带有西班牙语字符á,é,í…ñ的twitter,显然它们存储得很好,但是当我使用python将它们加载到RDD中时,这些字母被\xe1、\xe9替换。。等等。你知道吗

示例:

u'RT@rodriguezjoma:El#petr\xf3leo y#Repsol fracasan en su intento de superar resistencias:https://t.co/EtmZynrxQGhttps://t.co/JQcG5gk4Cd', 你需要一个安静的世界,一个美丽的世界哦

我该怎么做才能找到合适的角色?你知道吗


Tags: 示例字母世界twitter字符elrddrt