Pandas到纽比阵列为斯凯乐派林

class PercentageTransformer(TransformerMixin): def __init__(self, colname,typePercentage='totalTarget', _target='TARGET', _dropOriginal=True): self.colname = colname self._target = _target self._dropOriginal = _dropOriginal self.typePercentage = typePercentage def fit(self, X, y, *_): original = pd.concat([y,X], axis=1) grouped = original.groupby([self.colname, self._target]).size() if self.typePercentage == 'totalTarget': df = grouped / original[self._target].sum() else: df = (grouped / grouped.groupby(level=0).sum()) if self.typePercentage == 'totalTarget': nameCol = "pre_" + self.colname else: nameCol = "pre2_" + self.colname self.nameCol = nameCol grouped = df.reset_index(name=nameCol) groupedOnly = grouped[grouped[self._target] == 1] groupedOnly = groupedOnly.drop(self._target, 1) self.result = groupedOnly return self def transform(self, dataF): mergedThing = pd.merge(dataF, self.result, on=self.colname, how='left') mergedThing.loc[(mergedThing[self.nameCol].isnull()), self.nameCol] = 0 if self._dropOriginal: mergedThing = mergedThing.drop(self.colname, 1) return mergedThing

1条回答

网友

1楼 · 发布于 2024-10-02 18:23:41

前后转换

Pandas有一个.to_records（）方法，如您所述，还有一个.as_matrix（）方法。.to_records（）方法实际上会为您保留列名。Numpy不支持数组中的命名列。见here。在

坚持

熊猫有熊猫泡菜（obj，filename）方法，它接受pandas对象并pickles。有一个对应的熊猫。读琰泡菜（文件名）方法。在

Numpy还有一个save和load函数。在

相关问题更多 >

编程相关推荐

热门问题

热门文章