我是Python编码的新手,我遇到了一个关于csv文件数据操作的问题
基本上,我有2个csv文件,我导入感谢pd.read\u csv他们看起来像
df1 which has 9 rows including headers and 5 columns
df2 which has 65 rows including headers and same 5 columns
我想用df2中关于'NBIMAGE'
的句子替换df1中的句子,并保存第三个名为df3
的csv(或者只将df1的修改版本保存为df1,而不使用新文件)
换句话说,每当df1中的'NBIMAGE'与df2中的'NBIMAGE'相同时(即使行不同),它应该用df2中相同'NBIMAGE'的句子替换df1中该行的句子
我所做的是
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df1['newcolumn'] =
np.where (df1['NBIMAGE'] == df2['NBIMAGE'], df2['SENTENCE'], 0)
但它输出一个
ValueError: Can only compare identically-labeled Series objects
我不想使用replace,因为我们需要指定要替换的内容,但我认为对字符串使用numpy也不是最好的解决方案
我希望你能理解我的问题,并感谢大家对我的帮助
相关问题 更多 >
编程相关推荐