在我的数据清理器数据集中,我有列(功能)“项目ID”。标识项目,其格式为“code/YEAR/code”。我只对项目的年份感兴趣,所以我想把第一年之前/第二年/之后的所有东西都处理掉。在
Project ID
AGPG/2013/1
AGPG/2013/10
AGPG/2013/12
AGPG/2013/18
AGPG/2013/19
我最接近的就是把以前的东西脱光
^{2}$(但下面还有其他字母,所以这是不可分级的)
然后我做了
data_cleaner['Project ID'] = data_cleaner['Project ID'].str.strip('/')
这把最初的一点都丢掉了,我无法摆脱一年后的一切。在
Project ID
2013/1
2013/10
2013/12
2013/18
2013/19
我读了这篇文章,但没帮到我Pandas DataFrame: remove unwanted parts from strings in a column
我认为需要^{} 并选择第二个
lists
:或^{} 按regex-
^{pr2}$/(\d{4})/
表示在//
之间获得长度为4
的数字:相关问题 更多 >
编程相关推荐