我有一列列表,在其中我希望循环遍历所有行中列表的每个元素,并用字符串值替换所有数值。比如说
column
[10.50.21.134,10.30.2.197,SLO-Y30-001,IVER02-Y30-001,DCT-Y30-001]
[CHTN,WBGN,10.50.21.134,10.50.21.136,10.50.21.135]
我希望遍历列表中的每个元素,比较多行中的值,并将所有行替换为具有字符串的值
预期产出:
column
[CHTN,WBGN,SLO-Y30-001,IVER02-Y30-001,DCT-Y30-001]
[CHTN,WBGN,SLO-Y30-001,IVER02-Y30-001,DCT-Y30-001]
我有一个很大的数据集,可以在10行中进行比较,每行最多包含30个元素
到目前为止,我能做的是按行分组,用空值替换所有数字值,但我被卡住了,我不知道如何连接或合并,同时保持列表元素的顺序,这是比较所有行中每个元素并替换的最佳方法
@staticmethod
def test(df):
df['doc']=df['nwctdoctrail'].apply(lambda x : x.split(','))
df['doc']=df['doc'].apply(lambda x : [w[:-2] for w in x])
df['doc']=df['doc'].apply(lambda x: [w.replace(w,' ' if w[0].isdigit() else w) for w in x])
@staticmethod
def preprocess_df(df):
test=df.groupby('grouping_key').apply(test())
我得到的结果是:
doc
['','',SLO-Y30-001,IVER02-Y30-001,DCT-Y30-001]
[CHTN,WBGN,'','','']
目前没有回答
相关问题 更多 >
编程相关推荐