我有一个文本文件有很多这样的行。你知道吗
Jul 15 12:12:51 whitelist logger: 1|999999999999|id:d9faff7c-4016-4343-b494-37028763bb66 submit date:1307130919 done date:1307130919 stat:DELIVRD err:0|L_VB3_NM_K_P|1373687445|vivnel2|L_VB3_GH_K_P|promo_camp1-bd153424349bc647|1
我需要在数据库中插入值,因此我需要分离这些值。你知道吗
1) logger
2) submit date
3) done date
4) stat
5) err
下面是隔离记录器字符串的步骤。你知道吗
tail messages | grep logger: | awk -F'logger: ' '{print $2}' | awk '{print $1}'
这是划分字符串的正确方法吗? 有更好的选择吗?你知道吗
在Python中有许多方法可以实现这一点。一种简单的方法是使用Python的内置正则表达式。假设日志输出始终遵循上述规则,您可以提取如下感兴趣的部分:
groups()方法返回在
()
括号中找到的字符串的元组。你知道吗见http://docs.python.org/2/library/re.html
如果将关键字放入文件中,这将起作用:GNUsed的代码: 你知道吗
示例:
相关问题 更多 >
编程相关推荐