Pyspark RDD:转换为字符串

2024-09-28 17:17:36 发布

您现在位置:Python中文网/ 问答频道 /正文

使用rddfloat = rdd.map( (float(x[0]), float(x[1])) ),我将rdd的列转换为浮点数,以便可以对它们进行数学运算。现在我已经完成了数学运算,我想把它们转换回原来的StringType。

我试过rdd str=rddfloat((str(x[0]),str(x[1]),str(x[2])),它确实返回了一个字符串'40.745555',但这与原始的rdd u'40.745555'不同。它们之间的区别是什么,我怎样才能把它们转换回原来的样子呢?


Tags: 字符串map数学floatrdd浮点数区别str
1条回答
网友
1楼 · 发布于 2024-09-28 17:17:36

我假设您使用的是Python2.X,这意味着如果要生成unicode字符串,需要调用unicode,比如

rddstr = rddfloat( (unicode(x[0]), str(x[1]), str(x[2])) )

不过,为了更好地理解这些差异,我建议你在网上搜索,因为这是一个很常见的问题。例如,以下问题中报告的一些答案可能对您来说是合理的:

特别是,这个答案可能会帮助您:https://stackoverflow.com/a/18034409/126125

相关问题 更多 >