我想用das ml的变压器
为此,我有以下数据框:
当我尝试时:
从dask\u ml.preprocessing导入StandardScaler,quantilettransformer,MinMaxScaler
scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']])
我得到这个错误:
ValueError: Tried to concatenate arrays with unknown shape (1, nan). To force concatenation pass allow_unknown_chunksizes=True.
我找不到在哪里设置参数:allow\u unknown\u chunksizes=True 由于变压器中的电压升高而产生误差
如果我事先计算df,第一个错误就会消失:
scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']].compute())
但我不知道为什么这是必要的,或者即使这是正确的做法。 另外,与StandardScaler不同,它返回的是数组而不是数据帧
这是以前Dask-ML实现的一个限制。它固定在https://github.com/dask/dask-ml/pull/533
相关问题 更多 >
编程相关推荐