从数据帧列中删除字符

2024-06-01 19:20:40 发布

男 | 程序猿一只，喜欢编程写python代码。

下面是从类别列表和数据集中提取匹配值的代码。在

matches= token.apply(lambda x: pd.Series(x).str.extractall("|".join(["({})".format(cat) for cat in Categories.HealthCare])))
match_list= [[m for m in match.values.ravel() if isinstance(m, str)] for match in matches]
match_df = pd.DataFrame({"Hc1":match_list})

def match_health(row):
    categories = []

    for bigram in row.bigram:
        joined = ' '.join(bigram)
        if joined in HealthCare:
            categories.append(joined)
    for trigram in row.trigram:
        joined = ' '.join(trigram)
        if joined in HealthCare:
            categories.append(joined)

    return categories

match_df['Hc2'] = df.apply(match_health, axis=1)
match_df['HealthCare'] = match_df[match_df.columns[[0,1]]].apply(lambda x: ','.join(x.dropna().astype(str)),axis=1)

结果如下：

^{pr2}$

类型（匹配_df）

pandas.core.frame.DataFrame

但是我的输出应该没有“[]”-方括号和字符串周围的单引号，例如：

    Hc1                 Hc2                         HealthCare
0                                                   
1   Sauna, Jacuzzi   Health Club, Steam Room    Sauna,Jacuzzi,Health Club,Steam Ro...
2   Sauna, Jacuzzi   Health Club, Steam Room    Sauna,Jacuzzi,Health Club,Steam Ro...
3   Sauna, Jacuzzi   Health Club, Steam Room    Sauna,Jacuzzi,Health Club,Steam Ro...

需要帮助。在

Tags： in df for match steam categories apply join

2条回答

网友

1楼 · 编辑于 2024-06-01 19:20:40

match_df['HealthCare'] = match_df['HealthCare'].map(lambda x: x.replace('[','').replace(']','').replace("'",''))

这适用于替换所有方括号和单引号。在

开/关：

^{pr2}$

网友

2楼 · 编辑于 2024-06-01 19:20:40

您可以调用.str.replace：

match_df['HealthCare'] = match_df['HealthCare']\
                          .astype(str).str.replace(r"[\[\]']", '')

从数据帧列中删除字符

相关问题更多 >

编程相关推荐

热门问题

热门文章

从数据帧列中删除字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >