<p>我使用dataframe从excel文件中读取数据。文本变为:</p>
<pre><code>u"\u200bDuring the QA, bla bla bla,\xa0Head of bla bla\xa0for NZ,\xa0was labelled bla bal. With further investigation, bla bla bla bla bla bla."
</code></pre>
<p>我试图替换所有这些'u200b'、'\xa0'等,但仍然有一个“\'”无法替换,不知道为什么?你知道吗</p>
<pre><code>def replaceMultiplePattern(row):
for r in ((u'\n', u''), (u'\xa0', u' '), (u'\u2019', "'"), (u'\u2013', '-'), (u'\u200b', ''), (u"\' ", u"'")):
row = row.replace(*r)
return row
</code></pre>
<p>另外,在从excel文件读取数据时,是否有任何方法可以避免所有这些unicode转换?你知道吗</p>
<p>谢谢</p>