在Python中使用Pandas将csv的页脚(最后几行)保存为单独的文件

2024-05-08 23:13:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个csv文件,它在最末尾(最后9行)包含额外的行,这些行很重要,但根本不符合模式,需要以不同的方式进行处理。它们只包含不同站点的点击次数。我想从原始csv中拆分最后几行,并将其另存为一个文件

到目前为止,我可以使用pandas获得最重要的行,跳过页脚。如果行数一致,那么我可以使用skiprows=0-2000(例如)保存页脚,但这些行会发生变化

保存所有主要行的代码如下:

reader = pd.read_csv(os.path.join(DATA_DIR, file), encoding='utf8', header=0, skipfooter=9, index_col=0)
trimmed_file_name = 'trimmed_{}'.format(file)
path = os.path.join(DATA_DIR)
full_path = path + "\ ".strip(' ') + trimmed_file_name 
     # had to use this odd way of creating a path because it kept trying to use \ as an escape char, just ignore
print(full_path)
reader.to_csv(full_path, mode='a')

那么,如果没有“skiprows”,我该如何走出最后9行呢?有什么想法吗?如果有帮助的话,页脚始终位于最后9行


Tags: 文件csvtopathnamedataosdir