continuation by unicode decode2'

2024-06-28 11:51:33 发布

您现在位置:Python中文网/ 问答频道 /正文

基本上,我是用pandas来读取csv文件来分隔一个以“dd/mm/yy hh”格式的“Date+Hour”列。在

我在这里得到了帮助,试图编写一个脚本,将列分成两个不同的列。在

首先,数据集是这样的:

enter image description here

joint字段是“FECHA”,我设法在一些csv文件上运行了以下代码:

import pandas as pd,os
sal = pd.read_csv('C:/Users/drivasti/Documents/002_Script_Separa_Fecha_Hora/Anexo2_THP_UL.csv')

df=sal.join(sal['FECHA'].str.partition(' ')[[0, 2]]).rename({0: 'DATE', 2: 'HOUR'}, axis=1)

df.to_csv('C:/Users/drivasti/Documents/002_Script_Separa_Fecha_Hora/Anexo2_THP_UL_2.csv',index=False)

它们完美地工作在这里:

enter image description here


但是,我在尝试运行另一个csv文件时遇到了这个错误(请注意,每次必须运行该文件时,我都会更改该文件的名称,但它们都是csv文件):

^{pr2}$


现在,我尝试了一些答案,但都没有帮助:

UnicodeDecodeError: 'utf-8' codec can't decode byte
'utf-8' codec can't decode byte 0xdb in position 1:


有人知道怎么把它解析成UTF-8吗?还是“费哈”这个领域的问题?在


Tags: 文件csvpandasscriptusersdocumentspdsal