我想通过扩展BaseEstimator
和{
from sklearn.base import BaseEstimator, TransformerMixin
class GroupSelector(BaseEstimator, TransformerMixin):
def __init__(self, group_column):
self.group_column = group_column
def fit(self, X, y=None):
print(type(X))
return self
然后我按如下方式运行它(其中X
和y
是pandas数据帧):
但是,fit
中的print调用表示输出是一个numpy数组。在我的fit
方法中,我希望在数据帧上使用不同的分组运算符。在
scikit learn是否有理由将输入转换为numpy数组?如何将它们保存为数据帧?在
目前没有回答
相关问题 更多 >
编程相关推荐