如何用pysp将数据帧中没有标题的行放入列表

2024-09-25 00:27:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我从CSV文件得到这些数据,我需要将这些数据发送到服务器。但我需要的只是这个列表中的值。你知道吗

{1: Row(Moid=1, Tripid='1', Tstart='2007-05-27', Tend='2007-05-27 08:36:47.846', Xstart='12785', Ystart='1308', Xend='12785', Yend='1308'), 2: Row(Moid=2, Tripid='10', Tstart='2007-05-27', Tend='2007-05-28 08:52:53.673', Xstart='9716', Ystart='-55', Xend='9716', Yend='-55')}

我想要这个

{ (1,  1, 2007-05-27, 2007-05-2708:36:47.846 , 12785, 1308, 12785, 1308)
  (2, 10, 2007-05-27, 2007-05-2808:52:53.673 ,  9716,  -55,  9716,  -55)

Tags: 文件csv数据服务器列表rowtstartystart
1条回答
网友
1楼 · 发布于 2024-09-25 00:27:49

可以使用rdd和映射函数将行转换为元组。 我刚刚使用了前3个值作为示例实现: 你知道吗

df = spark.createDataFrame([(1,"1",'2007-05-27'),(2,"10", "2007-05-27")], ['moid',"tripid","tstart"])
print df.rdd.map(lambda r: tuple(r)).collect()

输出将是一个元组列表:

[(1, u'1', u'2007-05-27'), (2, u'10', u'2007-05-27')]

相关问题 更多 >