python中解析日志文件

10.243.166.74, 10.243.166.74 - - [08/Feb/2017:16:33:26 +0100] "GET /script/header_footer.js?_=1486568008442 HTTP/1.1" 200 2143 "http://www.trendtron.com/popmenu/home" "Mozilla/5.0 (Windows NT 6.1; rv:31.0) Gecko/20100101 Firefox/31.0 K-Meleon/75.1"

"10.243.166.74, 10.243.166.74" "08/Feb/2017" "16:33:26" "+0100" "GET /script/header_footer.js?_=1486568008442" "HTTP/1.1" "200" "2143" "http://www.trendtron.com/popmenu/home" "Mozilla/5.0" "(Windows NT 6.1; rv:31.0)" "Gecko/20100101" "Firefox/31.0"\ "K-Meleon/75.1"

2条回答

网友

1楼 · 编辑于 2024-09-30 20:26:49

为什么不把最后一组按空格分开呢？在

import re
log = '10.243.166.74, 10.243.166.74 - - [08/Feb/2017:16:33:26 +0100] "GET /script/header_footer.js?_=1486568008442 HTTP/1.1" 200 2143 "http://www.trendtron.com/popmenu/home" "Mozilla/5.0 (Windows NT 6.1; rv:31.0) Gecko/20100101 Firefox/31.0 K-Meleon/75.1"'

regex = re.compile('(.+?)\[(.*?)\] "(.*?)" (\d+) (\d+) "(.*?)" "(.*?)"')
res = regex.match(log)
log_parts = list(res.groups())
devices_browsers_info_str = log_parts.pop(-1)
devices_browsers_info_parts = devices_browsers_info_str.split(' ')
log_parts.extend(devices_browsers_info_parts)

给了我们

^{pr2}$

网友

2楼 · 编辑于 2024-09-30 20:26:49

(.+?)\- - \[(.+?)\:(.+?)\ (.+?)\] \"(.+?)\ (HTTP.+?)\" (.+?) (.+?) \"(.+?)\" \"(.+?) (.+?\)) (.+?)\ (.+?)\ (.+?)\"

或者：http://regexr.com/3fndb

相关问题更多 >

编程相关推荐

热门问题

热门文章