我正在尝试通过一个read a.csv文件搜索到一个数据帧,在其中搜索包含字符串“DSCRPT”的数据,并将其移动到另一个数据帧,然后合并它们,这样我将有两列。 到目前为止我有:
import csv
import pandas as pd
data = pd.read_csv('ctgs_list_ETS3.2.csv', 'r', encoding='utf-8')
data.rename(columns={0:'ID'}, inplace=True)
word = 'DSCRPT'
data1 = df.loc[data['ID'].str.contains(word, case=False)]
data1
但此时它崩溃了,我得到以下错误:
KeyError:'ID' 错误:迭代器应该返回字符串,而不是字节(您是在文本模式下打开文件的吗?)你知道吗
任何帮助都会很好。你知道吗
编辑:
数据框=pd.read\U csv文件('ctgs\u list\u ETS3.2.csv',encoding='utf-8')
df1 = df.iloc[:3000, :]
df2 = df.iloc[3000:, :]
df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='outer')
df3
但我得到的数据帧如下所示:
\uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu 27^ID\u CTG(28)=“增加2月1日”
28^ID\u CTG(29)='INC2MAY2'南
29^ID\u CTG(30)='INC2PB\u 1'南
。。。 ... ... 你知道吗
5970 NaN^DSCRPT\u CTG(2971)=''
5971南^ DSCRPT\u CTG(2972)=''
5972 NaN^DSCRPT\u CTG(2973)=''
我该如何摆脱NaN的价值观?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐