Python中文
首页
教程
问答
标签
搜索
登录
注册
从数据帧中删除Python中具有正则表达式模式的单词
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在用Python中的正则表达式处理以下数据</p> <pre><code> Random 0 helloooo 1 hahaha 2 kebab 3 shsh 4 title 5 miss 6 were 7 laptop 8 welcome 9 pencil </code></pre> <p>我想删除具有重复字母模式的单词(如blaaaa)、重复字母对(如hahaha)以及在一个字母周围具有相同相邻字母的任何单词(如tit</strong>le、ke<strong>bab</strong>、w<strong>ere</strong>)</p> <p>代码如下:</p> <pre><code>import pandas as pd data = {'Random' : ['helloooo', 'hahaha', 'kebab', 'shsh', 'title', 'miss', 'were', 'laptop', 'welcome', 'pencil']} df = pd.DataFrame(data) df = df.loc[~df.agg(lambda x: x.str.contains(r"([a-z])+\1{1,}\b"), axis=1).any(1)].reset_index(drop=True) print(df) </code></pre> <p>以下是以上的输出,并显示一条警告消息:</p> <pre><code>UserWarning: This pattern has match groups. To actually get the groups, use str.extract. Random 0 hahaha 1 kebab 2 shsh 3 title 4 were 5 laptop 6 welcome 7 pencil </code></pre> <p>然而,我希望看到:</p> <pre><code> Random 0 laptop 1 welcome 2 pencil </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>IIUC,您可以使用类似于<code>r'(\w+)(\w)?\1'</code>的模式,即一个或多个字母、可选字母和第一个匹配的字母。这将产生正确的结果:</p> <pre class="lang-py prettyprint-override"><code>df[~df.Random.str.contains(r'(\w+)(\w)?\1')] </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
3 回答
无法使用Django\u mssql\u后端迁移到外部hos
3 回答
无法使用Django&Python3.4连接到MySql
2 回答
无法使用Django+nginx上载媒体文件
10 回答
无法使用Django1.6导入名称模式
5 回答
无法使用Django1.7和mongodb登录管理站点
9 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
10 回答
无法使用Djangockedi验证CBV中的字段
5 回答
无法使用Djangocketditor上载图像(错误400)
7 回答
无法使用Djangocron进行函数调用
5 回答
无法使用Djangofiler djang上载文件
5 回答
无法使用Djangokronos
3 回答
无法使用Djangomssql provid
1 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
2 回答
无法使用Djangomssq迁移Django数据库
10 回答
无法使用Djangonox创建用户
2 回答
无法使用Djangopyodb从Django查询SQL Server
1 回答
无法使用Djangopython3ldap连接到ldap
7 回答
无法使用Djangoredis连接到redis
8 回答
无法使用Django中的FK创建新表
6 回答