根据特定条件将pandas中的两个字符串列组合成一个新列的最佳方法是什么？

pairs = [] for row in df['interest1']: if row == df['interest2'].iloc[row]: pairs.append(df['interest1'] + ' ' + df['interest2']) else: pairs.append(df['interest1'] + ' ' + df['interest3'])

#a simple example of what I would like to achieve import pandas as pd lst= [['music','music','film','music film'], ['guitar','piano','violin','guitar piano'], ['music','photography','photography','music photography'], ] df= pd.DataFrame(lst,columns=['interest1','interest2','interest3','first distinct pair']) df

1条回答

网友

1楼 · 发布于 2024-09-20 03:53:52

您可以对数据帧使用where方法

df['first_distinct_pair'] = (df['interest1'] + df['interest2']).where(df['interest1'] != df['interest2'],  df['interest1'] + df['interest3'])

如果要包含空格，可以执行以下操作：

df['first_distinct_pair'] = (df['interest1'] + ' '+ df['interest2']).where(df['interest1'] != df['interest2'],  df['interest1'] + ' ' + df['interest3'])

结果是：

 import pandas as pd
      ...: 
      ...: lst= [['music','music','film'],
      ...:       ['guitar','piano','violin'],
      ...:       ['music','photography','photography'],
      ...:      ]
      ...: 
      ...: df= pd.DataFrame(lst,columns=['interest1','interest2','interest3'])

>>> df['first_distinct_pair'] = (df['interest1'] + ' '+ df['interest2']).where(df['interest1'] != df['interest2'],  df['interest1'] + ' ' + df['interest3'])

>>> df
  interest1    interest2    interest3 first_distinct_pair
0     music        music         film          music film
1    guitar        piano       violin        guitar piano
2     music  photography  photography   music photography

相关问题更多 >

编程相关推荐

热门问题

热门文章