使用pandas删除列数超过4的行

2024-09-28 01:23:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有几个csv文件,我用pandas处理。我想删除超过3列的行。在

我该怎么办?在

谢谢你

编辑1

  id                                       ocr  raw_value   
4a82a357-99e7-49e6-85b6-b2f6a27b8d5f    OMNIPAGE    Terms        em
8b549fef-0cda-4af5-8239-35153c33ffbc    OMNIPAGE    price   
52ffe66a-b1ab-4b22-9b26-c298d53c951c    OMNIPAGE    Renseignements  
507a0d96-9481-4b3f-8c35-f16588bedc0b    OMNIPAGE    pour    
52e171dc-8d22-4162-b748-692b2fc11659    OMNIPAGE    Client  
c40a7e9f-1ec4-4cac-87e8-02ed0f335fe9    OMNIPAGE    5           client
4a936ed7-c082-4f46-9fa1-761a1525e2df    OMNIPAGE    SAS 
4b78130e-b099-400c-b7bf-6470e0519783    OMNIPAGE    des 
4d5c6297-1c79-42f9-b4ea-929a9abfb3f7    OMNIPAGE    431 
829d8bf5-b251-4bb1-82d8-0e912ab64e8e    OMNIPAGE    59  102
5ed5b74d-efc5-49fa-9b12-dbe3ca88995f    OMNIPAGE    votre   votre
58d26125-1120-4328-83c4-7f5b0135184d    OMNIPAGE    Crécy,  Crécy,

在本例中:要删除的第一行和第六行有额外的列emclient


Tags: 文件csvclientid编辑pandasrawvalue
2条回答

如果可能的话,错误只是额外的一列。那就把这个传过来pd.read_csv文件. 在

error_bad_lines=False

error_bad_lines : boolean, default True Lines with too many fields (e.g. a csv line with too many commas) will by default cause an exception to be raised, and no DataFrame will be returned. If False, then these “bad lines” will dropped from the DataFrame that is returned. (Only valid with C parser)

CSV文件应该有固定的列数。Pandas不是CSV格式验证程序(即使它能够处理一些错误)。 如果您有一个格式不正确的CSV(在您的例子中,每列中的行数可变),您应该在将其输入Pandas之前对其进行预先验证。在

例如:https://pypi.python.org/pypi/csvvalidator

或者自己编写的代码非常简单。在

相关问题 更多 >

    热门问题