我正在想办法解决这个问题
第一行包含:编号:INC00012,附加注释:尚未请求
第二行包含:NUMBER:INC0000001,AdditionalComment:w尚未请求 DF\u FILE\u PATH=指向csv的方向。包含这些行的文件
WrongData_REG_EXP =(DF_FILE_PATH
.filter(DF_FILE_PATH.Number.rlike('^((?!INC([0-9]){7}).)*$'))
.filter(DF_FILE_PATH.AdditionalComments.rlike('^((?!Not Yet Requested).)*$'))
)
display (WrongData_REG_EXP)
当我只加载一个过滤器时,它显示的变量不正确。但当我添加一个新的过滤器。它什么也没显示。这是因为没有包含这两个正则表达式的行。 但是另一行有第二个过滤器,第一行有第一个过滤器
我如何同时显示它们
我用python在Databricks中解决了这个问题
完整的数据集减去良好的记录,错误的记录仍然存在
相关问题 更多 >
编程相关推荐