Spark 学习: spark 原理简述与 shuffle 过程介绍-CSDN博客

网站介绍:文章浏览阅读4.7w次,点赞49次,收藏193次。Spark学习: 简述总结 Spark 是使用 scala 实现的基于内存计算的大数据开源集群计算环境.提供了 java,scala, python,R 等语言的调用接口.Spark学习 简述总结引言1 Hadoop 和 Spark 的关系Spark 系统架构1 spark 运行原理RDD 初识shuffle 和 stage性能优化1 缓存机制和 cache 的意义2 shu_spark 原理