Python:删除datafram中><之间的信息以外的所有字符串

2024-10-01 19:17:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要删除单元格中的所有内容,但包含在><

我有一个100*15的数据帧,看起来像这样:

df = pd.DataFrame(['irus 1/3 km >A001< absc ','#$ jiadhf 3 >A002<', '#AB >A003<'], columns=['AFF'])

df

    AFF
0   irus 1/3 km >A001< absc
1   #$ jiadhf 3 >A002<
2   #AB >A003<

我需要得到这样的结果:

    AFF
0   A001
1   A002
2   A003

我发现我需要使用一个类似于re.sub('[^>]+>', '', y)的命令,但是我已经尝试了几次,我可以得到我需要的确切信息

谁能帮我一下吗


Tags: 数据ltgt内容dfabpdaff
1条回答
网友
1楼 · 发布于 2024-10-01 19:17:03

您可以将^{}捕获组一起使用:

In [1]: import pandas as pd

In [2]: df = pd.DataFrame(['irus 1/3 km >A001< absc ','#$ jiadhf 3 >A002<', '#AB >A003<'], columns=['AFF'])

In [3]: df['AFF'] = df['AFF'].str.extract(r">([A-Z0-9]+)<")

In [4]: print(df)
    AFF
0  A001
1  A002
2  A003

相关问题 更多 >

    热门问题