按列对文件排序并获取uniq元素

from operator import itemgetter import itemgetter def get_unique(data): seen="" for e in data: if e not in seen: seen="\t".join(seen) return seen col2="" with open("myfile.txt", "r") as infile, open("out.xls","w") as outfile: for line in infile: data=line.rstrip.split("\t") sorted_data=sorted(data, key=lambda e: e.itemgetter) col2="".join(data[1]) uniq_col2=get_unique(col2) outfile.write(sorted_data)# tab-delimited sorted data outfile.write(uniq_col2) # sorted column 2 data

1条回答

网友

1楼 · 发布于 2024-09-23 22:32:41

试试这个：

from operator import itemgetter

with open('test.txt') as infile, open('out.txt', 'w') as outfile:
    # sort input by 2nd column
    sorted_lines = sorted(
        (line.strip().split() for line in infile),
        key=itemgetter(1)
        )

    # output sorted input
    for line in sorted_lines:
        outfile.write('\t'.join(line))
        outfile.write('\n')

    # discard duplicates in already sorted sequence => uniq items
    prev_item = None
    for item in (line[1] for line in sorted_lines):
        if item != prev_item:
            prev_item = item
            outfile.write(item)
            outfile.write('\n')

相关问题更多 >

编程相关推荐

热门问题

热门文章