筛选python中不遵循正则表达式模式的字符串

l = ['Dubai', 'St. Petersburg', 'Aachen', '21323', '123134', 'Klaus@facebook.com'] l = pd.DataFrame(l) pattern = re.compile("([A-Z])\w+|(\w[A-Z\u00E4-\u02AF])\w+", re.UNICODE) df = l.filter(regex=pattern) print(df)

1条回答

网友

1楼 · 发布于 2024-10-04 15:26:45

df.filter()方法根据行/列的名称而不是其内容进行筛选；如文档中所述：“请注意，此例程不会对数据框的内容进行筛选。此筛选应用于索引的标签。”

要执行所需操作，您可以定义这样一个函数来进行模式匹配：

import numpy as np
import re

def like(x, pattern):
    r = re.compile(pattern)
    vlike = np.vectorize(lambda val: bool(r.fullmatch(val)))
    return vlike(x)

然后将其传递给.loc[]：

df = df.loc[like(df['column_name'], pattern), :]

现在，df应该只包含列'column_name'与给定模式匹配的行

您可以在this article中看到一个示例

编程相关推荐

osx上的java慢速springws/hibernate应用程序
resttemplate Java Rest模板
java使用HMACSHA256+AES/GCM/NOP实现PBKDF2的最简单示例：javax。加密。AEADBadTagException:GCM中的mac签入失败
JavaCDIBeans和JPA事务
java connect pod从k8s连接到谷歌存储
java如何利用辅助类来处理事件？
java如何在安卓存储上保存文件、写入文件以及以后访问文件？
java如何展平生成的wsimport对象
java初始化的数组是否保留其顺序？
java为什么返回true而不是堆栈溢出？

相关问题更多 >

编程相关推荐

热门问题

热门文章

筛选python中不遵循正则表达式模式的字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >