比较两个制表符分隔的文件

网友

1楼 · 编辑于 2024-06-26 00:30:51

可以使用DBD::CSV以类似SQL的方式处理问题：

#!/usr/bin/env perl
use strict;
use utf8;
use warnings 'all';

use Data::Printer;
use DBI;

my $dbh = DBI->connect('dbi:CSV:', undef, undef, {
    f_encoding      => 'utf8',
    csv_quote_char  => undef,
    csv_escape_char => undef,
    csv_sep_char    => "\t",
    csv_eol         => "\n",
    csv_quote_space => 0,
    csv_quote_null  => 0,
    csv_tables      => {
        fileA       => { file => 'fileA.tsv' },
        fileB       => { file => 'fileB.tsv' },
    },
    RaiseError      => 1,
    PrintError      => 1,
}) or die "DBI/DBD::CSV error: " . $DBI::errstr;

my $sth = $dbh->prepare(<<SQL_QUERY);
    SELECT *
    FROM fileA
    JOIN fileB ON
        (StrtA <= StpB) OR (StrtB <= StpA)
    WHERE Name IS NOT NULL
SQL_QUERY

$sth->execute;
while (my $row = $sth->fetchrow_arrayref) {
    p $row;
}
$sth->finish;
$dbh->disconnect;

（不过，我不确定我是否理解您的重叠条件）

网友

2楼 · 编辑于 2024-06-26 00:30:51

我绝对建议您使用pandas来执行类似的操作。将两者都加载到单独的数据帧中，然后您应该能够以您希望看到的格式将它们合并在一起。在

网友

3楼 · 编辑于 2024-06-26 00:30:51

使用bedtools相交：http://code.google.com/p/bedtools/wiki/Usage#intersectBed

（你也可以问http://www.biostars.org/）

相关问题更多 >

编程相关推荐

热门问题

热门文章

比较两个制表符分隔的文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >