嗨,我想知道如何在PySpark中转换RowMatrix。在
data = [(MLLibVectors.dense([1.0, 2.0]), ), (MLLibVectors.dense([3.0, 4.0]), )]
df=sqlContext.createDataFrame(data, ["features"])
features=df.select("features").rdd.map(lambda row: row[0])
mat=RowMatrix(features)
print mat.rows.first()
#[1.0,2.0]
mat=mat.Transpose()
print mat.rows.first()
#[1.0,3.0]
有人用Python实现这个吗?我也看到过类似的帖子,但都是用Scala写的。谢谢。在
RowMatrix没有
transpose
方法。您可能需要一个BlockMatrix或一个CoordinateMatrix。在相关问题 更多 >
编程相关推荐