熊猫数据框重复

2024-06-26 00:11:41 发布

您现在位置:Python中文网/ 问答频道 /正文

对Pandas和python不太熟悉,有一个问题是在整个数据帧中替换多个unicode字符。使用Python2.7并从excel表导入。我的愿望是将所有非ascii字符替换为其等价的ascii字符,或者什么都不替换。在

示例:
u'SHOGUN日语\u2013 GRAND'
u'COMFORT INN&SUITES\Xaostone MOUNTAIN酒店

这是可行的,但很麻烦:

rawdf = rawdf["Account_Name"].str.upper().str.replace(u'\u2013', ' ').str.replace(u'\xa0', '-') + "|" + rawdf["COID"].str.upper()

这不起作用:

^{pr2}$

Tags: 数据示例pandasasciiunicode字符excelupper