对Pandas中的特定列应用正则表达式

1条回答

网友

1楼 · 发布于 2024-09-30 20:18:15

您可以在循环中使用str.contains。您需要传递regex模式（而不是编译的regex对象）。在

这就是我要说的：

In [1062]: df.head()
Out[1062]: 
   tweetID            tweet-text    RegExp1    RegExp2    RegExp3 RegExp4
0    10001   to get it or?                                               
1    10333   I just wonder :)                                            
2    10933   is it possible dude                                         
3    14633   he is good at 

In [1063]: regexes = [
      ...:     'i asked .* said',
      ...:     'you asked me what .*',
      ...:     '(?:to get|to see|to look|is it true|is it possible) .*',
      ...:     'I .* wonder .*'
      ...: ]

接下来，为每个regex模式运行一个循环。调用str.contains并依次将结果分配给每个列：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

对Pandas中的特定列应用正则表达式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >