如果我想从这个class 'pandas.core.index.Index
中提取一个['Horror'、'Adult'、'Cult Movies'等]的列表,那么什么正则表达式最适合这个呢?什么东西把所有的东西都抓住,直到一个封闭的括号?你知道吗
但如果“电视”以大写字母T开头,那么这是一个糟糕的方法吗?这里的方法应该是什么?我以前从没用过正则表达式。你知道吗
Index([u'variable[T.Horror]', u'variable[T.Adult]', u'variable[T.Cult Movies]', u'variable[T.Mystery & Suspense]', u'variable[T.Science Fiction & Fantasy]', u'variable[T.Western]', u'variable[T.Gay & Lesbian]', u'Q("Tomato-meter")', u'variable[T.Comedy]', u'variable[T.Television]', u'variable[T.Kids & Family]', u'variable[T.Classics]', u'variable[T.Drama]', u'variable[T.Art House & International]', u'variable[T.Romance]', u'variable[T.Special Interest]', u'variable[T.Animation]', u'variable[T.Documentary]', u'variable[T.Musical & Performing Arts]', u'variable[T.Sports & Fitness]', u'variable[T.Faith & Spirituality]', u'variable[T.Anime & Manga]', u'Intercept'], dtype='object')
可以使用以下正则表达式:
见DEMO
您可以在列表中使用以下正则表达式:
这个正则表达式使用了positive look-around,它将匹配
(?<=\[T\.)
和(?=\])
之间没有]
的每一个thin。你知道吗还要注意的是,作为一种更加python和优化的方式,我使用
re.compile
在列表理解之外编译regex,以拒绝在每次迭代中编译regex。你知道吗相关问题 更多 >
编程相关推荐