Spark Scala数据框具有单个Group By的多个聚合

编程入门 行业动态 更新时间:2024-10-09 10:25:57
本文介绍了Spark Scala数据框具有单个Group By的多个聚合的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧! 问题描述

Spark Scala数据帧具有单个group by的多个聚合.例如

Spark Scala Data Frame to have multiple aggregation of single group by. eg

val groupped = df.groupBy("firstName", "lastName").sum("Amount").toDF()

但是如果我需要计数,总和,最大值等

But What if I need Count, Sum, Max etc

/* Below Does Not Work , but this is what the intention is val groupped = df.groupBy("firstName", "lastName").sum("Amount").count().toDF() */

输出 groupped.show()

-------------------------------------------------- | firstName | lastName| Amount|count | Max | Min | --------------------------------------------------

推荐答案

case class soExample(firstName: String, lastName: String, Amount: Int) val df = Seq(soExample("me", "zack", 100)).toDF import org.apache.spark.sql.functions._ val groupped = df.groupBy("firstName", "lastName").agg( sum("Amount"), mean("Amount"), stddev("Amount"), count(lit(1)).alias("numOfRecords") ).toDF() display(groupped)

更多推荐

Spark Scala数据框具有单个Group By的多个聚合

本文发布于:2023-11-22 08:02:50,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1616600.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:多个   数据   Spark   Scala   Group

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!