网站介绍:文章浏览阅读651次。这几天面试被问到了好几次RDD,感觉都没令面试官满意,下面做了一些简单总结,欢迎大家指出问题:可以从几个方面来回答,概念、源码层、容错性、缓存、分区等概念RDD,全称是弹性分布式数据集(Resilient Distributed Dataset),是spark底层的抽象概念,弹性主要体现在 :其数据默认是放在内存中,只有放不下了才会放到磁盘,并且每个task执行失败可以进行重新计算;分布..._spark rdd是什么 面试
- 链接地址:https://blog.csdn.net/dz77dz/article/details/101623901
- 链接标题:spark面试:RDD总结_spark rdd是什么 面试-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:3814
- 网站标签:spark rdd是什么 面试