强制numpy中的NAs使用非数字字符（将csv读取到数据帧时）

import iopro adapter = iopro.text_adapter(filename, parser='csv',delimiter='\t',output='dataframe',infer_types=False) adapter.set_field_types({0: 'u4',3:'f8', 4:'f8',6:'object'}) all_treatments.append(adapter[[0,3,4,6]][:])

LopNr SJUKHUS MVO INDATUMA UTDATUMA HDIA DIAGNOS OP PVARD EKOD1 EKOD2 EKOD3 EKOD4 EKOD5 ICD 1562 21001 046 20030707 20030711 I489A I489A I509 2 10 1562 21001 046 2003o730 20030801 I501 I501 I489A DG001 2 10

1条回答

网友

1楼 · 发布于 2024-09-26 22:51:09

可以在^{}中使用参数converters：

def converter(num):
    try:
        return np.float(num)
    except:
        return np.nan

#define each column
converters={'INDATUMA': converter, 'UTDATUMA': converter}

df = pd.read_table(filename, converters=converters)
print df
   LopNr  SJUKHUS  MVO  INDATUMA  UTDATUMA   HDIA DIAGNOS     OP  PVARD  \
0   1562    21001   46  20030707  20030711  I489A   I489A   I509      2   
1   1562    21001   46       NaN  20030801   I501    I501  I489A  DG001   

   EKOD1  EKOD2  EKOD3  EKOD4  EKOD5  ICD  
0     10    NaN    NaN    NaN    NaN  NaN  
1      2     10    NaN    NaN    NaN  NaN

或使用^{}的参数errors='coerce'进行后处理：

df['INDATUMA'] = pd.to_numeric(df['INDATUMA'], errors='coerce')
0    20030707
1         NaN
Name: INDATUMA, dtype: float64

相关问题更多 >

编程相关推荐

热门问题

热门文章