从ex读取数据时如何避免unicode问题

def replaceMultiplePattern(row): for r in ((u'\n', u''), (u'\xa0', u' '), (u'\u2019', "'"), (u'\u2013', '-'), (u'\u200b', ''), (u"\' ", u"'")): row = row.replace(*r) return row

2条回答

网友

1楼 · 编辑于 2024-10-02 22:37:03

在python中加载excel后，可以使用unicodedata模块。您也可以在保存excel文件时使用其编码。你知道吗

text= u"\u200bDuring the QA, bla bla bla,\xa0Head of bla bla\xa0for NZ,\xa0was labelled bla bal. With further investigation, bla bla bla bla bla bla."
from unicodedata import normalize 
t=normalize('NFD',text)
print(t)

您可能需要检查它们引用的documentation

Even if two unicode strings are normalized and look the same to a human reader, if one has combining characters and the other doesn’t, they may not compare equal.

网友

2楼 · 编辑于 2024-10-02 22:37:03

也许在导入文件时添加编码是有效的。你知道吗

import pandas as pd
pd.read_excel('data.csv' encoding='utf-8')

编程相关推荐

未处理java Google PubSub-resent消息
java CannotAcquireLockException+LockAcquisitionException
atlassian fisheye如何处理“C:\Program Files\Java\jre7\bin\server\JVM.dll”中缺少“服务器”JVM的问题
jboss 6.3 eap linux环境中ear部署中的java问题
java SQL顺序字符串主键
java ascii shift程序几乎适用于整个字符串
java中excel工作表中的一条记录插入多条记录所需的sql逻辑
java这个方法如何计算Rational（1）。hashCode（）？1的分子或分母本身就是1
java为什么在循环中的数组中分配引用后会出现NullPointerException？
java Seam 2中内置工厂的优势是什么

相关问题更多 >

编程相关推荐

热门问题

热门文章

从ex读取数据时如何避免unicode问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >