重新评估NaN的现有数据帧

from collections import OrderedDict test = OrderedDict([('totalSize', 82142), ('done', True), ('records', [OrderedDict([('Name', 'ASST SANTI PAOLO E CARLO'), ('BillingStreet', 'NA'), ('BillingCity', 'MILANO'), ('BillingState', 'MI'), ('BillingPostalCode', '20142'), ('BillingCountry', 'ITALY')]), OrderedDict([('Name', 'A O UNIVERSITARIA OSPEDALI RIUNITI TRIESTE'), ('BillingStreet', 'VIA FARNETO 3'), ('BillingCity', 'TRIESTE'), ('BillingState', None), ('BillingPostalCode', '34142'), ('BillingCountry', 'ITALY')])])]) testdf = pd.DataFrame(test['records'])

3条回答

网友

1楼 · 编辑于 2024-06-24 12:53:14

使用numpy库并将其转换为NAN，如下所示。你知道吗

import numpy as np
testdf.replace('NA', np.nan)

网友

2楼 · 编辑于 2024-06-24 12:53:14

一种方法是在创建数据帧后将所有“NA”字符串强制转换为None：

# add as many strings that you would want converted
na_replace = {
    'NA': None # or whatever null value you want
}

pd.DataFrame(test['records']).replace(na_replace)

网友

3楼 · 编辑于 2024-06-24 12:53:14

变身熊猫后有多种途径

df=df.mask(df.isin(['NA','N/A','na']))
df=df.replace(['NA','N/A','na'],np.nan)

相关问题更多 >

编程相关推荐

热门问题

热门文章