我怀疑,每当我试图用NaN
替换给定数据集中的?
时,我都会使用python提供的Numpy(np
这里)库用python编写以下代码
dataset = pd.read_excel("D:\Gursimran\AIML\Datasets\AdultIncomeData.xlsx")
dataset.replace('?', np.NaN, inplace=True)
当我运行此代码时,它不会显示任何错误,但当我尝试通过以下方式查看dataset中的更改时:
dataset.head(10)
然后,我可以在我的数据集中再次看到?
。这些?
没有被替换。谁能告诉我我错过了什么
请帮帮我
我猜部分/所有问号都被一些看不见的字符包围,如空格、制表符或换行符。例如,考虑以下样本数据:
如果我们使用
print(dataset)
,我们会看到:如果我们仔细查看打印的数据,我们可能会注意到,第三行的问号并不是唯一的,因为它没有与职业栏的右侧对齐。然而,第四排的问号似乎是唯一的,但事实并非如此。因此,在替换中的单个问号时
只有第一行和第二行中的是固定的:
这可以通过替换空白来解决。我们可以使用正则表达式,如中所示
结果将是:
相关问题 更多 >
编程相关推荐