如何使用apachesp在Python中移动标签

2024-10-01 17:27:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试转移标签点的标签,以便它们从0开始。马上解析数据获取.take(1) 下面的代码前面是这样:

[LabeledPoint(2001.0,[0.884123733793,0.610454259079,0.600498416968,0.474669212493,0.247232680947,0.357306088914,0.344136412234,0.339641227335,0.600858840135,0.425704689024,0.60491501652,0.419193351817])]

标签是年份,例如,2001.0是最大年份,1922.0是最小年份。区别是89.0,我要做的是改变标签,使它们从0开始,使新的minYear 0和新的maxYear 89保持相同的特性。我是apachespark的新手,希望能得到任何帮助。提前谢谢!这是我的代码:

^{pr2}$

Tags: 数据代码标签特性年份take区别新手
2条回答

基于@Daniel response,问题的单一解决方案(无需创建任何新函数):

parsedData = parsedDataInit.map(lambda lp:LabeledPoint(lp.label - minYear, lp.features))

你只要从每年中减去最小值。在

def normalize(data):
  labels = data.map(lambda lp: lp.label)
  minLabel = labels.min()
  return data.map(
    lambda lp: LabeledPoint(lp.label - minLabel, lp.features))

相关问题 更多 >

    热门问题