擅长:python、mysql、java
<p>看起来“visitdate”列的类型是String,可以用“unix”转换为时间戳,然后用“date\u format”转换为所需格式的字符串。在此之后,可以在Scala上执行分组:</p>
<pre><code>val visitMonthDf = df.withColumn("visitMonth", date_format(unix_timestamp($"visitdate", "dd/MM/yyyy").cast(TimestampType), "1/M/yyyy"))
visitMonthDf.groupBy("visitMonth").agg(sum($"totalamount"))
</code></pre>