现在我有了一个文件列表,我想将目标相同序列号的文件组合起来。每个文件包含数千行,每行都有这样的格式:日期、计数、读取
例如,第一个文件:
"2019-12-23 00:00:00",1123,211685,34650.75,33225.69,...(hundreds of similar numbers)
...(hundreds of similar lines)
"2020-02-23 06:00:00",1372,211685,34651.22,33224.6,...
"2020-02-23 12:00:00",1373,211685,34650.34,33224.74,...
第二个文件:
"2019-12-17 12:00:00",1101,211685,34649.3,33225.8...
...
"2020-02-15 00:00:00",1339,211685,34651.66,33225.32,...
"2020-02-15 06:00:00",1340,211685,34651.63,33225.19...
问题是,缺少的行可能在文件的开头或结尾。一个文件中可能缺少最初的100个读数,而另一个文件可能缺少最近的50个读数。我想知道合并它们的最佳方式是什么?我可以想到使用“SET”,但我不确定它是否能够在文件中间添加丢失的行。
已完成行的示例:
"2019-12-17 12:00:00",1101,211685,34649.3,33225.8...
...
"2019-12-23 00:00:00",1123,211685,34650.75,33225.69,...
...
"2020-02-15 00:00:00",1339,211685,34651.66,33225.32,...
"2020-02-15 06:00:00",1340,211685,34651.63,33225.19...
...
"2020-02-23 06:00:00",1372,211685,34651.22,33224.6,...
"2020-02-23 12:00:00",1373,211685,34650.34,33224.74,...
set
不维护顺序,但您可以稍后对其进行排序以获得所需的输出文件。当一个日期字符串以UTC格式写为年-月-日-小时-分-秒时,它可以按从高到低或从低到高排序,而无需任何日期转换。用美语“2019年6月31日下午12:30 MST”写,你需要转换成可排序的内容您可以尝试使用:
Demo
熊猫解决方案:
Demo
相关问题 更多 >
编程相关推荐