尝试将包含特定字符串的数据移动到中的新数据帧

2024-10-04 01:22:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试通过一个read a.csv文件搜索到一个数据帧,在其中搜索包含字符串“DSCRPT”的数据,并将其移动到另一个数据帧,然后合并它们,这样我将有两列。 到目前为止我有:

import csv
import pandas as pd
data = pd.read_csv('ctgs_list_ETS3.2.csv', 'r', encoding='utf-8') 

data.rename(columns={0:'ID'}, inplace=True)
word = 'DSCRPT'

data1 = df.loc[data['ID'].str.contains(word, case=False)]
data1

但此时它崩溃了,我得到以下错误:

KeyError:'ID' 错误:迭代器应该返回字符串,而不是字节(您是在文本模式下打开文件的吗?)你知道吗

任何帮助都会很好。你知道吗

编辑:

数据框=pd.read\U csv文件('ctgs\u list\u ETS3.2.csv',encoding='utf-8')

df1 = df.iloc[:3000, :]
df2 = df.iloc[3000:, :]
df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='outer')
df3

但我得到的数据帧如下所示:

\uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu 27^ID\u CTG(28)=“增加2月1日”

28^ID\u CTG(29)='INC2MAY2'南

29^ID\u CTG(30)='INC2PB\u 1'南

。。。 ... ... 你知道吗

5970 NaN^DSCRPT\u CTG(2971)=''

5971南^ DSCRPT\u CTG(2972)=''

5972 NaN^DSCRPT\u CTG(2973)=''

我该如何摆脱NaN的价值观?你知道吗


Tags: 文件csv数据字符串importidtruedf