Kmeans使用数据帧列

2024-09-19 23:35:27 发布

男 | 程序猿一只，喜欢编程写python代码。

我有这样的想法：

wines = spark.table("dane_nowe_csv")
selected = wines.select("price")

价格是双倍。问题是如何将此“选定”类型转换为有效类型以用于：

clusters = KMeans.train(selected, 2, maxIterations=10, initializationMode="random")

我今天试着做了很多次，我搜索了几十个主题，总是有一些错误，我有一种感觉，有一些简单的方法可以做到这一点

Tags： csv 类型 table train 价格 select price spark

1条回答

网友

1楼 · 发布于 2024-09-19 23:35:27

wines = spark.table("dane_nowe_csv")
selected = wines.select("price").map(s => s.getAs[Vector])
clusters = KMeans.train(selected, 2, maxIterations=10,initializationMode="random")

KMeans将rdd作为输入，而不是数据帧或列

编程相关推荐

java Mac OS无法运行。Jar文件
Eclipse中java不可引发的POM错误
java指定用于bean的验证组
并发性如何确保Java方法中2条语句的顺序和完整执行
java为什么在抽象类中需要构造函数？
java使用链接打开我的Android应用程序
java允许在用户使用代码时选择一个或另一个名称
在Java中插入日期以访问数据库
将GWT RequestFactory与Grails一起使用时出现java类加载器问题
java JPA开始事务瓶颈

Kmeans使用数据帧列

相关问题更多 >

编程相关推荐

热门问题

热门文章

Kmeans使用数据帧列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >