我有一个csv文件,前2行的数据如下:
NewDateTime ResourceName
9/18/12 1:00 ANACACHO_ANA
9/18/12 2:00 ANACACHO_ANA
当我用熊猫数据帧读它时:
^{pr2}$我明白了
df1.columns
Index([u'NewDateTime', u'ResourceName', dtype='object')
但是,当我试着
df1['NewDateTime']
我得到错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 5: ordinal not in range(128)
同样,我的pycharm解释器上的df1['NewDateTime']有一个小破折号,就像df1['-NewDateTime']一样,但是当我把它粘贴到这里时,破折号没有出现
CSV文件似乎有一个BOM (Byte Order Mark) signature,所以尝试使用
'utf-8-sig'
、'utf-16'
或其他编码来解析BOM:下面是一个小演示:
^{pr2}$在我的iPython终端中,BOM签名在
u'?NewDateTime'
中显示为?
-在您的例子中,它是一个破折号:df1['-NewDateTime']
相关问题 更多 >
编程相关推荐