擅长:python、mysql、java
<p>这可以通过使用非常简单的bash命令获得,我的答案如下</p>
<pre><code>cat input.fasta #my input file
>gi|7290019|gb|AAF45486.1| (AE003417) EG:BACR37P7.1 gene product [Drosophila melanogaster]
MRMRGRRLLPIIL
cat input.fasta | grep -v ">" | fold -w1 | sort | uniq -c
</code></pre>
<p>输出:</p>
^{pr2}$
<p>fold-w1对每个字符进行拆分,对它们进行排序并计算唯一的字符数</p>