如何使用Perl、Python或bash更改列中值的运行

网友

1楼 · 编辑于 2024-09-27 17:54:19

用awk你可以说：

awk 'NR>1{if ($2 == prev) { $2 = a; } else { prev=$2; a=a+1; $2=a; }}1' OFS='\t' filename

对于您的输入，它将产生以下输出：

Col1    Col2
afawer  1
asdgf   1
aser    1
qwerq   2
a3awer  2
1sdgf   3
a55er   3
2wu9    4
asxwer  4
a2dgf   5
a1er    5
qperq   5

网友

2楼 · 编辑于 2024-09-27 17:54:19

对于Python，使用^{}对第二列上的行进行分组，并使用^{}提供的计数器：

import csv
from itertools import groupby
from operator import itemgetter

with open(inputfile, 'rb') as ifh, open(outputfile, 'wb') as ofh:
    reader = csv.reader(ifh, delimiter='\t')
    writer = csv.writer(ofh, delimiter='\t')
    writer.writerow(next(reader))  # copy across header

    for counter, (key, group) in enumerate(groupby(reader, itemgetter(1)), 1):
        for row in group:
            row[1] = counter
            writer.writerow(row)

这将使用相同的数据写入一个新的CSV文件，除了第二列被一个计数器（从1开始）替换，该计数器在第2列中的原始值每次更改时递增。你知道吗

网友

3楼 · 编辑于 2024-09-27 17:54:19

这是一个非常简单的Perl解决方案。它只跟踪第二列的前一个值，如果它发生变化，它会改变$n的值。你知道吗

程序希望输入文件的路径作为命令行上的参数，并将修改后的数据发送到STDOUT。你知道吗

use strict;
use warnings;

print scalar <>; # Copy header line

my ($prev, $n) = (0, 0);
while (<>) {
  chomp;
  my @fields = split /\t/;
  ($prev, $fields[1]) = ($fields[1], $fields[1] == $prev ? $n : ++$n);
  print join("\t", @fields), "\n";
}

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Perl、Python或bash更改列中值的运行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >