spar core 05

编程入门 行业动态 更新时间:2024-10-11 19:24:14

<a href=https://www.elefans.com/category/jswz/34/1754462.html style=spar core 05"/>

spar core 05

  • sequenceFile

    val seqRDD = sc.sequenceFile[BytesWritable,String]("path")
    

    泛型主要采用BytesWritable

  • 序列化

    • Java serialization
      速度慢,支持所有序列化类型
    • Kyro serialization
      速度快,不是支持所有的序列化类型
       val conf = new SparkConf().setMaster("local[2]").setAppName("SerializationApp").set("spark.serializer", "org.apache.spark.serializer.KryoSerializer").registerKryoClasses(Array(classOf[Student])) // 这个必须加入,如果不加的话,cache的数据会占用比java serialization更多内存
      
      spark.serializer不要写到代码中,最好写在spark-submit中的–conf
  • 序列化应用场景
    引入外部变量,cache,shuffle

更多推荐

spar core 05

本文发布于:2024-02-07 06:54:54,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1753984.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:spar   core

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!