Regex Python数据操作NoneType Obj

2024-09-30 12:22:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个.txt文件,数据格式如下:

pq1000007 35 2 237493054 0.013328573 

我尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于.4。由于某种原因,我得到的消息是“NoneType对象没有属性‘group’”。有什么想法吗?在

代码:

^{pr2}$

Tags: 文件对象代码txt消息属性group数字
2条回答

如果搜索结果为“无”,则表示正则表达式不匹配。对于您给出的示例,它似乎有效,但可能文件中的实际数据与模式不匹配。(另外,我看到您的regex包含\d+\d+,它应该是\d+。)

另外,match.group返回一个字符串。您需要将其转换为一个数字(例如,float(match.group(2)))以将其与数字0.4进行比较。在

几个问题:

regex匹配是一个字符串,因此不能有意义地将其与float进行比较(事实上,在python3中,这样做是非法的)。在python2中,任何字符串的比较总是大于一个浮点(因为ASCII中的"str"高于"float"。是的,这个规则没有意义。很好,Python3没有使用它)。在

然后,regex中的最后一个数字在第三个捕获组中,所以您需要

if float(match.group(3)) > 0.4:

然后,应该在正则表达式中使用逐字字符串(r"...")。在

最后,\d+\d+当然是多余的,\d+就可以了。在

^{pr2}$

此正则表达式与您给出的示例行相匹配,因此错误消息(表示不匹配)必须具有不同的来源。可能文件中的某个行与正则表达式不匹配。在这种情况下,您可以这样构建您的程序:

for Line in InFile:
    match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
    if match:
        if float(match.group(3)) > 0.4:
            # do stuff
        else:
            print "No match: ", Line

相关问题 更多 >

    热门问题