在Python中连接字符串数据

2024-06-28 19:43:56 发布

您现在位置:Python中文网/ 问答频道 /正文

晚安伙计们

首先,在数据帧中连接字符串的最佳方法是什么

我有一个CSV,它是一个窗体的输出。如果为if/else形式,则任何子问题的输出都已输出到新列中

由于表格的大部分都是儿童问题,我想写一个小脚本来做以下事情

1、删除无关列 2.用分隔符连接其余列。(',') 3.通过添加步骤1中的合并列和不相关列来创建新的DF

我的尝试:

import pandas as pd
import os
enter code here
df = pd.read_csv('survey.csv')

df
  Qual, Qual2,  Qual3, Qual4, Qual5, Qual6
0 IT    Digital NaN    NaN    NaN    NaN
1 NaN   NaN     Maths  NaN    NaN    NaN

df['Combined_Data'] = df.fillna('').astype(str).sum(axis=1)

df:
  Qual, Qual2,  Qual3, Qual4, Qual5,  Qual6 Combined Data
0 IT    Digital NaN    NaN    NaN     NaN   ITDigital
1 NaN   NaN     Maths  NaN    Algebra NaN   MathsAlgebra

我不确定如何添加一个,在每个总和之间,或者如果事实上总和是正确的方式来做这件事。。?可能不会。但这是我在几次谷歌搜索后发现的

任何帮助都将不胜感激


Tags: csvimportdfitnanpdcombineddigital
1条回答
网友
1楼 · 发布于 2024-06-28 19:43:56

^{}^{}一起使用:

df['Combined_Data'] = df.apply(lambda x: ', '.join(x.dropna()), axis=1)
print (df)
  Qual,   Qual2, Qual3,  Qual4,  Qual5,    Qual6   Combined_Data
0    IT  Digital    NaN     NaN     NaN      NaN     IT, Digital
1   NaN      NaN  Maths     NaN     NaN  Algebra  Maths, Algebra

相关问题 更多 >