将键/值对的Pyspark RDD解析为.csv格式

Records pre-transform: [[u'A=foo', u'B=bar', u'C=baz'], [u'A=oof', u'B=rab', u'C=zab'], [u'A=aaa', u'B=bbb', u'C=zzz']] ------------------------------ [u'foo', u'bar', u'baz'] [u'oof', u'rab', u'zab'] [u'aaa', u'bbb', u'zzz'] Final list of lists: []

1条回答

网友

1楼 · 发布于 2024-09-18 01:49:34

尝试此功能：

def processRecord(record, col_list):    
    csv_row=list()
    for idx, val in enumerate(record):
        key, value = val.split('=')        
        if(key==col_list[idx]):
            # print 'Col name match'
            # print value
            csv_row.append(value)
        else:
            csv_row.append(None)
            # print 'Key-to-Column Mismatch, dropping value.'
    return csv_row

然后呢

^{pr2}$

应该给予

Final list of lists: 
[[u'foo', u'bar', u'baz'], [u'oof', u'rab', u'zab'], [u'aaa', u'bbb', u'zzz']]

编程相关推荐

java如何在未来释放资源
java类型不匹配将char[]转换为对象
java例外。lang.IllegalArgumentException:比较法违反其一般合同含义？
java如何在fitnesse中拍摄表格失败时的屏幕截图
java卡片组程序返回空卡片
java如何在警报对话框的onclick侦听器中访问非final变量而不使其成为final
java Jetty embedded作为web服务的SPI提供程序不会向客户端发送webfault
“java.net.BindException:地址已在使用中”，尝试为负载测试快速创建和销毁socket时
java MPXJ：如何获取任务和资源以外的列？
JAVAlang.ClassNotFoundException:拒绝访问类加载器

相关问题更多 >

编程相关推荐

热门问题

热门文章

将键/值对的Pyspark RDD解析为.csv格式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >