有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何将数据集转换为JavaPairDD?

有几种方法可以将Dataset转换为JavaRDD

Dataset<Row> dataFrame;
JavaRDD<String> data = dataFrame.toJavaRDD();

有没有其他方法可以将数据集转换成javaPairRDD<Long, Vector>


共 (1) 个答案

  1. # 1 楼答案

    你可以像下面那样使用PairFunction。请检查数据集中元素的索引。在下面的示例中,索引0具有长值,索引3具有向量

    JavaPairRDD<Long, Vector> jpRDD = dataFrame.toJavaRDD().mapToPair(new PairFunction<Row, Long, Vector>() {
        public Tuple2<Long, Vector> call(Row row) throws Exception {
            return new Tuple2<Long, Vector>((Long) row.get(0), (Vector) row.get(3));
        }
    });