我已经编写了一个python程序来分析服务器日志(文本文件),并找到与用户输入不匹配的字符串。无论如何,十六进制编码的字符串不被程序考虑。 例:在下面的例子中,程序说用户输入没有不匹配的值,尽管'www.peoplesmonton.com'可用。请帮我避免这个?你知道吗
for line in lines:
match = re.search('\\b' + userinput + '\\b',line)
示例文本文件:
https://www.mysite.com/myworks/accaply/inquiry.asp
http://www.peoplesmonton.com/amb/cgi-bin/bank/bank/ambt%20Bank%20Of%20Frnak%20PLC_asp.htm
http://www.peoplesmonton.com/comblk/cgi-bin/bank/bank/ambt%20Bank%20Of%20ambt%20PLC_asp.htm
信息是用URL编码的,所以用
urllib2.unquote
来解码。你知道吗相关问题 更多 >
编程相关推荐