我有一列字符串,它们是ID,应该遵循以下格式:C-xxxxx-U-##或C-xxxxx-UX-###其中x可以是数字或大写字母。你知道吗
我想检查ID是否遵循这两种格式中的任何一种,如果不遵循,我想重新格式化字符串。你知道吗
一些示例数据:
C-20BV7-U-00
C-20BW5-U-00
C1AWT4-UR-00 <--- wrong format
C-1B8V9-UR-00
C-20BX2-U-00
我想这会给我一些不遵循这种格式的行
result=df["ID"].str.match(pat='C-[A-Z0-9]{5}-U[A-Z0-9]{0,1}-[0-9]{2}$')
temp=df.loc[~result,"ID"]
但是,我如何改变格式,以我想要的没有具体的替代,因为我不知道它到底会有什么不同的格式
使用特定的正则表达式替换:
相关问题 更多 >
编程相关推荐