擅长:python、mysql、java
<p>请看raj的答案,因为它更完整。我提供了我的解决方案,因为对于初学者来说可能更容易理解</p>
<p><code>sc.textfile</code>读取整行,因此<code>inputRDD</code>中只有一列。您需要首先按分隔符(空格或制表符)分割输入行。完成此操作后,可以选择要查找的相关列</p>
<pre><code>inputRDD1 = sc.parallelize(['a b','1 1','2 3'])
newrdd = inputRDD1 .map(lambda x: x.split( )[1])
newrdd.collect()
</code></pre>
<p>给予</p>
<pre><code>['b', '1', '3']
</code></pre>