我已经开始为数据科学学习Python。我几乎每天都在使用R。我在第一步就开始了。我尝试使用Pandas read_csv文件方法导入csv文件。导入时对文件进行编码时出现问题。在
如果我使用读取.csv从R开始一切正常:
df <- read.csv2("some_path/myfile.txt", stringsAsFactors = FALSE, encoding = 'UTF-8')
但是如果我在python中使用类似的代码:
^{pr2}$它返回一个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 13: invalid continuation byte
我怎么可能用R而不是Python导入一个用“utf-8”编码的文件?在
如果我使用不同的编码(latin1或iso-8859-1),它将成功导入文件,但字符编码方式不正确。在
即使我不明白为什么UTF-8在R中工作而在Python中不起作用,我也发现cp1250编码可以正常工作。在
使用编码“UTF-16”。我用它来解决我的问题,但也犯了同样的错误。在
相关问题 更多 >
编程相关推荐