Pandas DataFrame:在我想保留的内容之前和之后,从字符串中删除不需要的部分

2024-09-30 12:15:14 发布

您现在位置:Python中文网/ 问答频道 /正文

在我的数据清理器数据集中,我有列(功能)“项目ID”。标识项目,其格式为“code/YEAR/code”。我只对项目的年份感兴趣,所以我想把第一年之前/第二年/之后的所有东西都处理掉。在

Project ID  
AGPG/2013/1 
AGPG/2013/10
AGPG/2013/12
AGPG/2013/18
AGPG/2013/19

我最接近的就是把以前的东西脱光

^{2}$

(但下面还有其他字母,所以这是不可分级的)

然后我做了

data_cleaner['Project ID'] = data_cleaner['Project ID'].str.strip('/')

这把最初的一点都丢掉了,我无法摆脱一年后的一切。在

Project ID  
2013/1  
2013/10
2013/12
2013/18
2013/19

我读了这篇文章,但没帮到我Pandas DataFrame: remove unwanted parts from strings in a column


Tags: 数据项目功能projectiddata格式字母
1条回答
网友
1楼 · 发布于 2024-09-30 12:15:14

我认为需要^{}并选择第二个lists

data_cleaner['Project ID'] = data_cleaner['Project ID'].str.split('/').str[1]

^{}按regex-/(\d{4})/表示在//之间获得长度为4的数字:

^{pr2}$

相关问题 更多 >

    热门问题