如果一个非常大的文件不包含换行符，如何从中复制匹配项？

2条回答

网友

1楼 · 编辑于 2024-09-25 06:27:27

Grep从版本2.21开始有different behavior：

When searching binary data, grep now may treat non-text bytes as line terminators. This can boost performance significantly.

所以现在的情况是，对于二进制数据，所有的非文本字节（包括换行符）被视为行终止符。如果你想改变这个行为，你可以：

使用 text。这将确保只有换行符是行终止符
使用 null-data。这将确保只有空字节是行终止符

line-regexp option with null data

网友

2楼 · 编辑于 2024-09-25 06:27:27

#!/usr/bin/perl

use strict;
use warnings;

use constant BLOCK_SIZE => 64*1024;

my $buf = "";
my $searching = 1;
while (1) {
   my $rv = read(\*STDIN, $buf, BLOCK_SIZE, length($buf));
   die($!) if !defined($rv);
   last if !$rv

   while (1) {
      if ($searching) {
         my $len = $buf =~ m{\[(?:a|\z)} ? $-[0] : length($buf);
         substr($buf, 0, $len, '');

         last if $buf !~ s{^\[a}{};

         $searching = 0;
      } else {
         my $len = $buf =~ m{b(?:>|\z)} ? $-[0] : length($buf);
         print substr($buf, 0, $len, '');

         last if $buf !~ s{^b>}{};

         print("\n");
         $searching = 1;
      }
   }
}

做了很多假设：

假设开始标记的拼写完全是[a。你知道吗
假定结束标记的拼写完全是b>。你知道吗
假设每个开始标记都有相应的结束标记。你知道吗
假设每个结束标记都有相应的开始标记。你知道吗
假设在[a和b>之间找不到[a。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

如果一个非常大的文件不包含换行符，如何从中复制匹配项？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >