我有一个包含tweetID、tweettext、RegExp1、RegExp2、RegExp3、RegExp4列的数据集,以及一个包含4个正则表达式的列表。 我想在tweet text列上逐个应用正则表达式,如果tweet text满足正则表达式,那么我想在相应的RegExp列中设置值为1,如果不满足,我就把它设置为0。在
例如,假设tweet文本满足正则表达式编号1,那么我想将相应的RegExp1列的值设置为1,而不满足正则表达式2,那么我希望将相应的RegExp2列的值设置为0,依此类推。我试过最后给出的代码,但没用。在
我的数据集看起来像
tweetID | tweet-text | RegExp1 | RexExp2 | RegExp3 | RexExp4
---------------------------------------------------------------------
10001 | to get it or? | | | |
10333 | I just wonder :) | | | |
10933 | is it possible dude| | | |
14633 | he is good at | | | |
代码:
^{pr2}$(最好使用熊猫)谢谢
您可以在循环中使用
str.contains
。您需要传递regex模式(而不是编译的regex对象)。在这就是我要说的:
接下来,为每个regex模式运行一个循环。调用
^{pr2}$str.contains
并依次将结果分配给每个列:相关问题 更多 >
编程相关推荐