擅长:python、mysql、java
<p>如果数据以文件形式出现,可以这样实现:</p>
<ol>
<li>以CSV格式读取文件</li>
<li>添加“单调递增”的索引列</li>
<li>选择第一列,然后选择所有剩余列作为数组。在</li>
</ol>
<p>在Scala上可以这样实现:</p>
<pre><code>val df = spark.read.option("header", "false").csv("non-csv.txt")
val remainingColumns = df.columns.tail
df.withColumn("id", monotonically_increasing_id).
select(
col("id"),
col(df.columns(0)),
array(remainingColumns.head, remainingColumns.tail: _*)
).show(false)
</code></pre>
<p>输出:</p>
^{pr2}$