我有100个文件要根据文件中的mir_seq
合并。输出应该是一个包含原始文件中的mir_seq
和freq
列的文件。你知道吗
文件如下所示:
文件1:
mir_seq seq name freq mir start end mism add t5 t3 s5 s3 DB ambiguity
hsa-miR-143-3p_TGAGAAGAAGCACTGTAGCTCTT TGAGAAGAAGCACTGTAGCTCTT seq_100006_x0 0 hsa-miR-143-3p 61 81 6AT u-TT 0 0 AGTCTGAG GCTCAGGA miRNA 1
hsa-miR-10a-5p_GACCCTGTAGATCCGAATTTGTA GACCCTGTAGATCCGAATTTGTA seq_100012_x1 1 hsa-miR-10a-5p 22 43 1GT u-A 0 u-G TATATACC TGTGTAAG miRNA 1
hsa-miR-10a-5p_GACCCTGTAGATCCGAATTTGTG GACCCTGTAGATCCGAATTTGTG seq_100013_x54 54 hsa-miR-10a-5p 22 44 1GT 0 0 0 TATATACC TGTGTAAG miRNA 1
文件2:
mir_seq seq name freq mir start end mism add t5 t3 s5 s3 DB ambiguity
hsa-miR-143-3p_TGAGAAGAAGCACTGTAGCTCTT TGAGAAGAAGCACTGTAGCTCTT seq_100006_x1 1 hsa-miR-143-3p 61 81 6AT u-TT 0 0 AGTCTGAG GCTCAGGA miRNA 1
hsa-miR-10a-5p_GACCCTGTAGATCCGAATTTGTA GACCCTGTAGATCCGAATTTGTA seq_100012_x0 0 hsa-miR-10a-5p 22 43 1GT u-A 0 u-G TATATACC TGTGTAAG miRNA 1
hsa-miR-10a-5p_GACCCTGTAGATCCGAATTTGTG GACCCTGTAGATCCGAATTTGTG seq_100013_x24 24 hsa-miR-10a-5p 22 44 1GT 0 0 0 TATATACC TGTGTAAG miRNA 1
hsa-miR-1296-5p_TTAGGGCCCTGGCTCCATCT TTAGGGCCCTGGCTCCATCT seq_100019_x17 17 hsa-miR-1296-5p 16 35 0 0 0 u-CC TGGGTTAG CTCCTTTA miRNA 1
这些文件的名称如下所示,仅在_
和.txt.mirna
之间的部分不同,并且用制表符分隔:
Miraligner_94G.txt.mirna
Miraligner_944G.txt.mirna
输出文件应如下所示:
mir_seq freq_94G freq_944G freq_912R
hsa-miR-143-3p_TGAGAAGAAGCACTGTAGCTCTT 0 12 55
好的,假设你正在处理文件:
看起来你只是从每一列中挑出一列。你知道吗
所以:
给定数据集输出(制表符分隔):
注意-如果一个值未定义,它当前将打印一个零。如果你想印别的东西,你需要修改那张地图。你知道吗
它还按字母顺序对大多数这些进行排序-这也可能不是你想要的,但有很多排序的例子,你可以参考。你知道吗
您只提供了一个示例输入文件,因此显然这是未经测试的,因为您不能仅用一个文件测试“合并”:
相关问题 更多 >
编程相关推荐