擅长:python、mysql、java
<p>您可以使用<a href="https://www.gnu.org/software/gawk/manual/html_node/Arrays.html#Arrays" rel="nofollow">array</a>来记录第五列的所有可见值。在</p>
<pre><code>$ gawk '/^ATOM/ {seen[$5] = 1} END {print length(seen)}' 1kg2.pdb
2
</code></pre>
<p><strong>编辑:</strong>使用gawk 4.x,您可以使用<a href="https://www.gnu.org/software/gawk/manual/html_node/BEGINFILE_002fENDFILE.html#BEGINFILE_002fENDFILE" rel="nofollow">^{<cd1>}</a>生成所需的输出:</p>
^{pr2}$
<p>结果是:</p>
<pre><code>$ gawk -f pdb.awk 1kg2.pdb 1uz3.pdb 2b69.pdb
pdb_id subunits
1kg2.pdb 2
1uz3.pdb 3
2b69.pdb 1
</code></pre>