spark面试:RDD总结_spark rdd是什么 面试-CSDN博客

网站介绍:文章浏览阅读651次。这几天面试被问到了好几次RDD,感觉都没令面试官满意,下面做了一些简单总结,欢迎大家指出问题:可以从几个方面来回答,概念、源码层、容错性、缓存、分区等概念RDD,全称是弹性分布式数据集(Resilient Distributed Dataset),是spark底层的抽象概念,弹性主要体现在 :其数据默认是放在内存中,只有放不下了才会放到磁盘,并且每个task执行失败可以进行重新计算;分布..._spark rdd是什么 面试