检测datafram中的重复关键字

2024-10-02 08:25:48 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有以下数据

ID         Text            time
1          cri             2018-01-29 12:00:01
1          crim            2018-01-29 12:00:02
1          crimi           2018-01-29 12:00:03
1          crimin          2018-01-29 12:00:04
1          crimina         2018-01-29 12:00:05
1          criminal        2018-01-29 12:00:06
1          in              2018-01-29 13:00:01
1          ind             2018-01-29 13:00:02
1          indi            2018-01-29 13:00:03
1          india           2018-01-29 13:00:04
2          fu              2018-01-29 12:00:01
2          fun             2018-01-29 12:00:02
2          func            2018-01-29 12:00:03
2          funct           2018-01-29 12:00:04
2          functi          2018-01-29 12:00:05
2          functio         2018-01-29 12:00:06
2          function        2018-01-29 12:00:07
2          by              2018-01-29 13:00:02
2          bye             2018-01-29 13:00:03

我想找出一个身份证,在一段时间内,我们是否可以确定cri,crim,crimi都与犯罪有关,并删除其余的行。我想知道在python/Data-science中是否有任何方法可以检测并删除它。我想要这样的输出

ID         Text            time
1          criminal        2018-01-29 12:00:06
1          india           2018-01-29 13:00:04
2          function        2018-01-29 12:00:07
2          bye             2018-01-29 13:00:03

有人能给我建议用python做这件事的方法吗?你知道吗


Tags: 数据方法textinidtimefunctionbye

热门问题