按列和行筛选正则表达式。合并

WrongData_REG_EXP =(DF_FILE_PATH .filter(DF_FILE_PATH.Number.rlike('^((?!INC([0-9]){7}).)*$')) .filter(DF_FILE_PATH.AdditionalComments.rlike('^((?!Not Yet Requested).)*$')) ) display (WrongData_REG_EXP)

1条回答

网友

1楼 · 发布于 2024-09-28 22:35:53

我用python在Databricks中解决了这个问题

query = '''
       Get Corrupt records
    select * from bi4it_da.{0}_{1}_{2}_full_no_corrupt_NEW
    where number in
    (
    SELECT {0}_{1}_{2}_Full_No_Corrupt_NEW.number FROM BI4IT_DA.{0}_{1}_{2}_Full_No_Corrupt_NEW
    MINUS
    SELECT {0}_{1}_{2}_Full_Data_Set.number FROM BI4IT_DA.{0}_{1}_{2}_Full_Data_Set
    )
    '''.format(PROCESS_TYPE, SOURCE_SYSTEM, SOURCE_FILE_NAME)
display(spark.sql(query))

完整的数据集减去良好的记录，错误的记录仍然存在

编程相关推荐

java如何在mongodb中获取用户有权访问的数据库列表？
基于契约和类不变量的java设计
java我的代码有什么问题，似乎是正确的，但事实并非如此
java Android初学者：布局按钮和文本
400错误Paypal令牌API与Java（HttpURLConnection）
为什么Java从socket中随机读取数据，而不是整个消息？
如果我调用scanner，我会扫描两次。先是下一个，然后是扫描仪。下一个
如果消息发送失败，java ActiveMQ/JMS不重试
java有没有类似于dynaTrace的开源框架？
java Android：获取zip中的文件数（使用存储卷/存储访问框架）

相关问题更多 >

编程相关推荐

热门问题

热门文章

按列和行筛选正则表达式。合并

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >