我有这样一个表格的文本文件:
06/01/2016, 10:40 pm - abcde
07/01/2016, 12:04 pm - abcde
07/01/2016, 12:05 pm - abcde
07/01/2016, 12:05 pm - abcde
07/01/2016, 6:14 pm - abcde
fghe
07/01/2016, 6:20 pm - abcde
07/01/2016, 7:58 pm - abcde
fghe
ijkl
07/01/2016, 7:58 pm - abcde
您可以看到,每一行都用换行符隔开,但有些行内容中有换行符。因此,简单地按行分隔并不能正确地分析每一行。你知道吗
例如,对于第5个条目,我希望输出
07/01/2016, 6:14 pm - abcde fghe
这是我目前的代码:
with open('file.txt', 'r') as text_file:
data = []
for line in text_file:
row = line.strip()
data.append(row)
考虑到
','
只能作为分隔符出现,我们可以检查行是否有逗号,如果没有,则将其连接到最后一行:根据您的示例输入,您可以使用具有前瞻性的regex:
印刷品:
在Dropbox示例中,打印:
如果要删除捕获内容中的
\n
,只需将m.group(1).strip().replace('\n', '')
添加到上面的列表中。你知道吗正则表达式说明:
您可以使用正则表达式(使用^{} 模块)检查如下日期:
相关问题 更多 >
编程相关推荐