我有一个维度为100*512
的csv文件,我想在spark
中进一步处理它。文件的问题是它不包含头,即column names
。我需要这些列名以便在machine learning
中进一步ETL。我在另一个文件(文本文件)中有列名。我必须把这些列名作为头放在上面提到的csv文件中。
e、 g
CSV文件:
ab 1 23 sf 23 hjh
hs 6 89 iu 98 adf
gh 7 78 pi 54 ngj
jh 5 22 kj 78 jdk
列标题文件:
one,two,three,four,five, six
我想要这样的输出:
one two three four five six
ab 1 23 sf 23 hjh
hs 6 89 iu 98 adf
gh 7 78 pi 54 ngj
jh 5 22 kj 78 jdk
请建议将列标题添加到CSV文件中的方法(不替换CSV文件的行)。 我试过把它转换成pandas数据帧,但无法得到预期的输出。
Unix系统:
窗口:
首先读取csv文件:
如果数据集中有两列(a列和b列),请使用:
将此新数据帧写入csv
你可以使用它:
相关问题 更多 >
编程相关推荐