Pandas在阅读过程中跳过最后X行

2024-10-03 19:22:12 发布

您现在位置:Python中文网/ 问答频道 /正文

有时数据库末尾带有专有标记(即最后5行是copywrite通知),需要忽略这些标记,否则会扰乱数据集。简单地使用skiprowsnrows对某些行号进行硬编码是不可行的,因为不同的数据库文件可能具有不同的长度。在使用各种read函数时,有没有办法让pandas跳过文件的最后X行?在

澄清: 在我的经验中,您在数据文件底部发现的最常见的通知是

Name
Copyright (c) _____ All rights reserved.
Confidentiality Notice
Owner
Owner company

其中所有这些都只是第一列中的文本,在数据结束后的1行或多行空行之后被粘住(空格可以使用df.dropna(how='all' inplace=True)处理)。在

注意:python减号表示法,即skiprows=-7不起作用,而且开放式硬编码ie skiprows=[195:]也不起作用(因为解释器在文件被读取之前不知道文件的长度)。在


Tags: 文件数据函数标记数据库编码readowner