为的输出指定列名系列结构摘录()

1条回答

网友

1楼 · 发布于 2024-10-08 23:18:17

将这些名称嵌入正则表达式是一种正确的方法。它声明在documentation中这样做。你知道吗

如果您已经有了一些名为0、1和2的列，那么使用.rename()的第一个解决方案就不可靠了。你知道吗

在我看来，regex解决方案是最好的，但是您可以开始使用.pipe()这样的方法来实现函数。然而，正如您将看到的，当您不想要相同的regex时，它开始变得混乱。你知道吗

def extract_colnames(df, column, sep, cnames, drop_col=True):
    if drop_col:
        drop_col = [column]
    else:
        drop_col = []
    regex = '(?P<' + ('>.*)' + sep + '(?P<').join(cnames) + '>.*)'
    return df.join(df.loc[:, column].str.extract(regex, expand=True)).drop(drop_col, axis=1)

cnames = ['col1','col2','col3']
data = data.pipe(extract_colnames, column='colname',
                 sep='_', cnames=cnames, drop_col=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章

为的输出指定列名系列结构摘录()

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >