使用dask量化变压器时出现值错误:未知形状(1,nan)

2024-06-01 10:22:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用das ml的变压器

为此,我有以下数据框:

enter image description here

当我尝试时:

从dask\u ml.preprocessing导入StandardScaler,quantilettransformer,MinMaxScaler

scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']])

我得到这个错误:

ValueError: Tried to concatenate arrays with unknown shape (1, nan). To force concatenation pass allow_unknown_chunksizes=True.

我找不到在哪里设置参数:allow\u unknown\u chunksizes=True 由于变压器中的电压升高而产生误差

如果我事先计算df,第一个错误就会消失:

scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']].compute())

但我不知道为什么这是必要的,或者即使这是正确的做法。 另外,与StandardScaler不同,它返回的是数组而不是数据帧


Tags: 数据df错误transformmlunknownfitallow