<P>我试图用Python规范Selk DeaFrrAm中的列。</p>
<p>我的数据集:</p>
<pre><code>--------------------------
userID|Name|Revenue|No.of.Days|
--------------------------
1 A 12560 45
2 B 2312890 90
. . . .
. . . .
. . . .
--------------------------
</code></pre>
<p>在这个数据集中,除了用户id和名称,我必须规范收入和天数。</p>
<p>输出应该如下所示</p>
<hr/>
<pre><code>userID|Name|Revenue|No.of.Days|
--------------------------
1 A 0.5 0.5
2 B 0.9 1
. . 1 0.4
. . 0.6 .
. . . .
--------------------------
</code></pre>
<p>用于计算或规范化每个列中的值的公式是</p>
<pre><code>val = (ei-min)/(max-min)
ei = column value at i th position
min = min value in that column
max = max value in that column
</code></pre>
<p>如何使用PySpark简单地完成此操作?</p>