擅长:python、mysql、java
<p>在这里,我在python正则表达式中尝试了它</p>
<p>在这里,我将基因和序列分为两个序列</p>
<pre><code>import re
f=open('seq',"r")
input=(f.readlines())
print(input)
patt=".+?\[gene=(.+?)]\s\[locus_tag=.+?]\s\[db_xref=GeneID:.+?]\s\
[location=.+?]\s\[gbkey=.+?]\s(.+)"
for i in input:
x=re.search(patt.decode('utf-8'),i.decode('utf-
8'),re.DOTALL|re.MULTILINE|re.IGNORECASE|re.UNICODE)
print x.groups()
</code></pre>
<p>输出将是</p>
<pre><code>group1=(u'ORF6',u'ATGTTTCATCTCGTTGACTTTCAGGTTACTATAGCAGAGATATTACTAATTATTATGAGG
ACTTTTAAAG\n')
group2=(u'ORF6',u'ATGTTTCATCTCGTTGACTTTCAGGTTACTATAGCAGAGATATTACTAATTATTAT
GAGGACTTTTAAAG\n')
</code></pre>