在文本文件中指定标题并构建数组

->DQB1*02:02:01:01 GAACTTTGCTCTTTTCACCAAAACTTAAGGCTCCTCAGGGTGTGTCTAAGACAACAGCAGTAAAAATGTCTATGACAGCAATTTTCTCTCCCCTGAAATATGATCCCCACTTAATTTGCCCTATTGAAAGAATCCCAAGTATAAGAACAACTGGTTTTTAATCAATATTACAAAGATGTTTACTGTTGAATCGCATTTTTCTTTGGCTTCTTAAAATCCCTTAGGCATTCAATCTTCAGCTCTTCCATAAT ->OMIXON_CONSENSUS_M-86-11-9517_DQB1*02:02:01 GTCCAAGCTGTGTTGACTACCACTACTTTTCCCTTCGTCTCAATTATGTCTTGGAAGAAGGCTTTGCGGATCCCTGGAGGCCTTCGGGTAGCAACTGTGACCTTGATGCTGGCGATGCTGAGCACCCCGGTGGCTGAGGGCAGAGACTCTCCCGGTAAGTGCAGGGCCACTGCTCTCCAGAGCCGCCACTCTGGGAACAGGCTCTCCTTGGGCTGGGGT ->GENDX_CONSENSUS_M-86-11-9517_DQB1*02:02:01:01 TGCCAGGTACATCAGATCCATCAGGTCCAAGCTGTGTTGACTACCACTACTTTTCCCTTCGTCTCAATTATGTCTTGGAAGAAGGCTTTGCGGATCCCTGGAGGCCTTCGGGTAGCAACTGTGACCTTGATGCTGGCGATGCTGAGCACCCCGGTGGCTGAGGGCAGAGACTCTCCCGGTAAGTGCAGGGCCACTGCTCTCCAGAGCCGCCACTCTGGGA

def readfile(): with open ("testAllele1.txt", "r") as myfile: y = myfile.read() with open(y) as z: for line in z: # build array counter=1 if line.startswith(">"): #header array header(counter)=line counter=counter+1 else: sequence(counter)=line #sequence array

1条回答

网友

1楼 · 发布于 2024-09-28 03:19:41

你的例子是错误的。所有行都以->开头

所以我假设你想在第一个空格处拆分它们

#! /usr/bin/env python

# read the file and split into lines
y = open("testAllele1.txt", "r").read()
z = y.splitlines()

# initialize
header = []
sequence = []

#loop over all lines
for line in z:
    if line.startswith("->"):
        h, s = line.split()
        h = h[2:] # cut away the leading "->"
        header.append(h)
        sequence.append(s)

print header
print sequence

相关问题更多 >

编程相关推荐

热门问题

热门文章