我想使用awk(尽管对python/pandas解决方案开放)从timeseries数据集中提取除特定日期之外的所有内容。特定的日期只在整个文件中有时出现,因为只有在leapyear期间有记录时,才会出现leapyear日期。你知道吗
数据集如下所示,以leapyear day实例发生的位置为例:
02-28 HammondBay 139 279 30 49.23281860 -123.96769714 4 5150 69.9
02-29 HammondBay 139 279 30 49.23281860 -123.96769714 1 1437 50.9
03-01 HammondBay 139 279 30 49.23281860 -123.96769714 4 5754 59.0
03-02 HammondBay 139 279 30 49.23281860 -123.96769714 4 5732 54.8
03-03 HammondBay 139 279 30 49.23281860 -123.96769714 4 5724 128.5
因此,要明确的是,预期的结果是从这个以制表符分隔的timeseries数据集中删除02-29的每个实例的文件。你知道吗
要删除以
02-29
前缀开头的所有行,可以使用sed -i
:或者使用
grep
+sponge
:其中来自
moreutils
的sponge
实用程序允许覆盖管道中用作输入的文件。你知道吗如何
grep
:我在this site遇到了一些移除(或剥离)方法
因此,使用awk解决上述问题的方法是:
相关问题 更多 >
编程相关推荐