根据条件替换不同文件中的字符串

2024-09-30 02:26:16 发布

男 | 程序猿一只，喜欢编程写python代码。

我是Python编码的新手，我遇到了一个关于csv文件数据操作的问题

基本上，我有2个csv文件，我导入感谢pd.read\u csv他们看起来像

我想用df2中关于'NBIMAGE'的句子替换df1中的句子，并保存第三个名为df3的csv（或者只将df1的修改版本保存为df1，而不使用新文件）

换句话说，每当df1中的'NBIMAGE'与df2中的'NBIMAGE'相同时（即使行不同），它应该用df2中相同'NBIMAGE'的句子替换df1中该行的句子

我所做的是

df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

df1['newcolumn'] = 
np.where (df1['NBIMAGE'] == df2['NBIMAGE'], df2['SENTENCE'], 0)

但它输出一个 ValueError: Can only compare identically-labeled Series objects

我不想使用replace，因为我们需要指定要替换的内容，但我认为对字符串使用numpy也不是最好的解决方案

我希望你能理解我的问题，并感谢大家对我的帮助

Tags： columns and 文件 csv which read 句子 rows

1条回答

网友

1楼 · 发布于 2024-09-30 02:26:16

df3 = df1.drop('SENTENCE',axis=1).merge(df2[['NBIMAGE','SENTENCE']],how='left', on='NBIMAGE')