如何仅读取字符串或子字符串的特定部分

str_count = [] counter = 0 highest = 0 # read sequence with open(argv[2], "r") as seq: seqRead = seq.read() for i in range(len(seqRead)): #search for consecutive AGATC if i == 'A' and seqRead[i:i+6] == 'AGATC': while i == 'A' and seqRead[i:i+6] == 'AGATC': counter += 1 i = i + 5 if highest < counter: highest = counter counter = 0 else: counter = 0

AGATCAGATCAGATCAGATCAGATCDJFDHFDTTTTCCSSDDSDDGFJFHAGATCAGATCAGATCAGATCAGATCAGATGJFHJGHJDSHGDKFSAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCDKFDKDFKGJKDFKAGATCkFGJKFDDAGATCDFKJKFJFKDJKAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCAGATCKFDHDFKFDHKGHKDFGJFKHDFK

2条回答

网友

1楼 · 编辑于 2024-10-01 22:39:40

子字符串太长，seqRead[i:i+6]将给出长度为6个字符的字符串，而不是5个字符的字符串。该行（以及进行类似比较的另一行）应改为seqRead[i:i+5]。另外，您试图将迭代器（i）与字母进行比较，而我认为您的意思是比较seqRead中迭代器位置处的字母i == 'A'应更改为seqRead[i] == 'A'：

    str_count = []
    counter = 0
    highest = 0
    # read sequence

    with open(argv[2], "r") as seq:
        seqRead = seq.read()
        for i in range(len(seqRead)):
            #search for consecutive AGATC
            if seqRead[i] == 'A' and seqRead[i:i+5] == 'AGATC':
                while seqRead[i] == 'A' and seqRead[i:i+5] == 'AGATC':
                    counter += 1
                    i = i + 5
            if highest < counter:
                highest = counter
                counter = 0
            else:
                counter = 0

网友

2楼 · 编辑于 2024-10-01 22:39:40

在代码中if之前的while循环是多余的。您正在切片不正确的子字符串，下面是更新和简化的代码：

for i in range(len(seqRead)):
    while seqRead[i:i+5] == "AGATC":
        counter += 1
        i += 5
    if counter > highest:
        highest = counter
    counter = 0

相关问题更多 >

编程相关推荐

热门问题

热门文章