Pandas在阅读过程中跳过最后X行

2024-10-03 19:22:12 发布

男 | 程序猿一只，喜欢编程写python代码。

有时数据库末尾带有专有标记（即最后5行是copywrite通知），需要忽略这些标记，否则会扰乱数据集。简单地使用skiprows和nrows对某些行号进行硬编码是不可行的，因为不同的数据库文件可能具有不同的长度。在使用各种read函数时，有没有办法让pandas跳过文件的最后X行？在

澄清：在我的经验中，您在数据文件底部发现的最常见的通知是

Name
Copyright (c) _____ All rights reserved.
Confidentiality Notice
Owner
Owner company

其中所有这些都只是第一列中的文本，在数据结束后的1行或多行空行之后被粘住（空格可以使用df.dropna(how='all' inplace=True)处理）。在

注意：python减号表示法，即skiprows=-7不起作用，而且开放式硬编码ie skiprows=[195:]也不起作用（因为解释器在文件被读取之前不知道文件的长度）。在

Tags：文件数据函数标记数据库编码 read owner

0条回答

目前没有回答