我有一个df
:
ClassOfYear
0 ClassOfYear 2019 something
1 x ClassOfYear 2012 random text
2 Amy ClassOfYear 2004
3 David Beckham ClassOfYear 1994
...
我想创建一个新的列,只在ClassOfYear
之后包含文本。i、 e:
ClassOfYear
0 ClassOfYear 2019 something
1 ClassOfYear 2012 random text
2 ClassOfYear 2004
3 ClassOfYear 1994
...
编辑: 通常每个字符串中都有一年,我们可以用这一年创建另一列吗? 预期产出:
ClassOfYear Year
0 ClassOfYear 2019 something 2019
1 ClassOfYear 2012 random text 2012
2 ClassOfYear 2004 2004
3 ClassOfYear 1994 1994
...
您可以使用带有
assign
的简单正则表达式,或者只广播您的列.*
是一种贪婪的方法,用于匹配ClassOfYear
之后直到字符串结尾的所有内容(行终止符除外)尝试使用
str.replace
:这种方法是匹配从列开始到(但不包括)文本
ClassOfYear
的所有内容。然后,我们用空字符串替换以删除此文本。请注意,此替换不会影响根本没有文本ClassOfYear
的列值相关问题 更多 >
编程相关推荐