在python中按第一列（或第二列或其他列）对文件排序

ENSMUSG00000098737 95734911 95734973 3 miRNA ENSMUSG00000077677 101186764 101186867 4 snRNA ENSMUSG00000092727 68990574 68990678 11 miRNA ENSMUSG00000088009 83405631 83405764 14 snoRNA ENSMUSG00000028255 145003817 145032776 3 protein_coding ENSMUSG00000028255 145003817 145032776 3 processed_transcript ENSMUSG00000028255 145003817 145032776 3 processed_transcript ENSMUSG00000098481 38086202 38086317 13 miRNA ENSMUSG00000097075 126971720 126976098 7 lincRNA ENSMUSG00000097075 126971720 126976098 7 lincRNA

3条回答

网友

1楼 · 编辑于 2024-06-01 21:40:23

与SuperBiasedMan的想法相同，但我更喜欢这种方法：如果您想要另一种排序方式（例如：如果第一列匹配，则按第二列排序，然后按第三列排序等），则更容易实现

with open(my_file) as f:
    lines = [line.split(' ') for line in f]
output = open("result.txt", 'w')

for line in sorted(lines):
    output.write(' '.join(line), key=itemgetter(0))

output.close()

网友

2楼 · 编辑于 2024-06-01 21:40:23

你的问题是你没有把每一行都变成一个列表。当你读入文件时，你得到的只是整个行的字符串。然后按每行的第一个字符进行排序，这始终是输入中的相同字符，'E'。

要按第一列排序，您需要将第一个块分割开来，然后阅读该部分。所以你的关键应该是：

for line in sorted(lines, key=lambda line: line.split()[0]):

split将把您的行变成一个列表，然后从该列表中获取第一列。

网友

3楼 · 编辑于 2024-06-01 21:40:23

如果输入文件是制表符分隔的，也可以使用csv模块。

import csv
from operator import itemgetter
reader = csv.reader(open("t.txt"), delimiter="\t")

for line in sorted(reader, key=itemgetter(0)):
    print(line)

按第一列排序。

在中更改号码

key=itemgetter(0)

用于按不同列排序。

编辑

相关问题更多 >

编程相关推荐

热门问题

热门文章