Pandas DataFrame：在我想保留的内容之前和之后，从字符串中删除不需要的部分

2024-09-30 12:15:14 发布

男 | 程序猿一只，喜欢编程写python代码。

在我的数据清理器数据集中，我有列（功能）“项目ID”。标识项目，其格式为“code/YEAR/code”。我只对项目的年份感兴趣，所以我想把第一年之前/第二年/之后的所有东西都处理掉。在

Project ID  
AGPG/2013/1 
AGPG/2013/10
AGPG/2013/12
AGPG/2013/18
AGPG/2013/19

我最接近的就是把以前的东西脱光

^{2}$

（但下面还有其他字母，所以这是不可分级的）

然后我做了

data_cleaner['Project ID'] = data_cleaner['Project ID'].str.strip('/')

这把最初的一点都丢掉了，我无法摆脱一年后的一切。在

Project ID  
2013/1  
2013/10
2013/12
2013/18
2013/19

Tags：数据项目功能 project id data 格式字母

1条回答

网友

1楼 · 发布于 2024-09-30 12:15:14

我认为需要^{}并选择第二个lists：

data_cleaner['Project ID'] = data_cleaner['Project ID'].str.split('/').str[1]

或^{}按regex-/(\d{4})/表示在//之间获得长度为4的数字：

^{pr2}$