按列表顺序将两个数据帧列与列表合并问题的回答

按列表顺序将两个数据帧列与列表合并

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我正在尝试合并/连接两个列，其中两个列都有相关但由“|”分隔的文本数据，此外，还将某些名称替换为“”，并将|替换为“\n”。你知道吗 例如，原始数据可以是： <pre><code> First Names Last Names 0 Jim|James|Tim Simth|Jacobs|Turner 1 Mickey|Mini Mouse|Mouse 2 Mike|Billy|Natasha Mills|McGill|Tsaka </code></pre> 如果我想合并/连接以派生全名并删除与“Smith”相关的条目，则最终的df应该如下所示： <pre><code> First Names Last Names Full Names 0 Jim|James|Tim Simth|Jacobs|Turner James Jacobs\nTim Turner 1 Mickey|Mini Mouse|Mouse Mickey Mouse\nMini Mouse 2 Mike|Billy|Natasha Mills|McGill|Tsaka Mike Mills\nBilly McGill\nNatasha Tsaka </code></pre> 我目前的做法是： <pre><code>def parse_merge(df, col1, col2, splitter, new_col, list_to_exclude): orig_order = pd.Series(list(df.index)).rename('index') col1_df = pd.concat([orig_order, df[col1], df[col1].str.split(splitter, expand=True)], axis = 1) col2_df = pd.concat([orig_order, df[col2], df[col2].str.split(splitter, expand=True)], axis = 1) col1_melt = pd.melt(col1_df, id_vars=['index', col1], var_name='count') col2_melt = pd.melt(col2_df, id_vars=['index', col2], var_name='count') col2_melt['value'] = '(' + col2_melt['value'].astype(str) + ')' col2_melt = col2_melt.rename(columns={'value':'value2'}) melted_merge = pd.concat([col1_melt, col2_melt['value2']], axis = 1 ) if len(list_to_exclude) > 0: list_map = map(re.escape, list_to_exclude) melted_merge.ix[melted_merge['value2'].str.contains('|'.join(list_map)), ['value', 'value2']] = '' melted_merge[new_col] = melted_merge['value'] + " " + melted_merge['value2'] </code></pre> 如果我打电话： <pre><code>parse_merge(names, 'First Names', 'Last Names', 'Full Names', ['Smith']) </code></pre> 数据变成： <pre><code> Index First Names count value value2 Full Names 0 0 Jim|James|Tim 0 Jim Smith '' 1 1 Mickey|Mini 0 Mickey Mouse Mickey Mouse 2 2 Mike|Billy|Natasha 0 Mike Mills Mike Mills </code></pre> 只是不确定如何在没有任何循环的情况下完成这个任务，或者是否有更有效/完全不同的方法。你知道吗 谢谢大家的意见！你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

按列表顺序将两个数据帧列与列表合并

1 个回答

相关Python问题