那么,如何区分空白值和缺失值呢?

2024-09-24 20:37:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我的示例文件(要加载到dataframe中)如下所示

col1,col2,col3,col4
10,a,111,hzlvkhaslkdvhs
20,b,345,ioadjf ogjdasoivj adoijf 
30,c,
40,d,987,;vjsdf;vm smgv 
50,e,,vbiodhfo vdofhb od

最后一行第三列为空白,这是有效数据。col1==30的行缺少最后几列。如果我在dataframe中加载此文件,它将以相同的方式处理缺失数据和空白数据

>>> df = pd.read_csv('test1.csv')
>>> df
   col1 col2   col3                       col4
0    10    a  111.0             hzlvkhaslkdvhs
1    20    b  345.0  ioadjf ogjdasoivj adoijf 
2    30    c    NaN                        NaN
3    40    d  987.0            ;vjsdf;vm smgv 
4    50    e    NaN         vbiodhfo vdofhb od

如何区分缺失字段和空白字段


Tags: 文件数据dataframevmnan空白col2col3