根据其他列值（PySpark）从DataFrame获取值

2条回答

网友

1楼 · 编辑于 2024-09-30 01:22:17

您可以很容易地从该数据帧上的select中分配一个变量。在

x = stats_df.select('mycol').where('summary' == 'min')

网友

2楼 · 编辑于 2024-09-30 01:22:17

好的，让我们考虑一下下面的例子：

from pyspark.sql.functions import rand, randn
df = sqlContext.range(1, 1000).toDF('mycol')
df.describe().show()
# +   -+        -+
# |summary|            mycol|
# +   -+        -+
# |  count|              999|
# |   mean|            500.0|
# | stddev|288.5307609250702|
# |    min|                1|
# |    max|              999|
# +   -+        -+

如果您想访问关于stddev的行，您只需将其转换为RDD，收集它并将其转换为字典，如下所示：

^{pr2}$

编程相关推荐

java redis。客户。绝地武士。例外情况。JedisConnectionException:连接到redis群集时无法从池中获取资源
java如何正确扩展JHipster用户实体
泛型这个Java语法意味着什么？（`Class<？扩展ContactAccessor>clazz`）
java SecurityException:权限拒绝：读取com。安卓提供者。媒体MediaProvider需要安卓。准许读取外部存储器
recyclerview之间的java交互
带有OnKeyListener的java AutoCompleteTextView
java无法访问类org的成员。springframework。数据jpa。util。带修改器的HibernateProxyDetector
java如何向celltable添加滚动条
java不能用SpringBoot将ArrayList中的2个以上元素保存到MySQL？
java如何传递javagent/path/to/newrelic。运行HiveMetaStore服务器的JVM的jar参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据其他列值（PySpark）从DataFrame获取值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >