我正在做一个项目,它读取pdf格式的列表并将列表转换为.csv文件,但是当我读取pdf时,文本会被传递到字符串,直到我没有问题为止,但是每次找到日期时,我都必须输入一个"\n"
,例如:
就像在字符串中:
'HELDER ALVES DE OLIVEIRA18/06/1986RENAN ALVES DE OLIVEIRA06/08/2005'
我想要的是:
'HELDER ALVES DE MEDEIROS;18/06/1986\NRENAN ALVES DE OLIVEIRA;06/08/2005\N'
所以当我打开文件时.csv会被制成表格。你知道吗
我认为您应该更好地利用^{} 模块的强大功能,正如Jules Mazur对前面答案的评论所指出的,您需要设置某种过滤无效日期,下面是一个示例:
您可以在这个regex demo中查看它的详细描述。 另外,您可以在regex库中找到更多日期和时间的高级
re
模式您可以使用regular expressions来实现这一点:
相关问题 更多 >
编程相关推荐