网站介绍:文章浏览阅读326次。大数据高速计算引擎Spark课程内容:MapReduce、Spark、Flink(实时) => 3代计算引擎;昨天、今天、未来MapReduce、Spark:类MR的处理引擎;底层原理非常相似;数据分区、map task、reduce task、shuffle第一部分 Spark Core第1节 Spark概述1.1 什么是SparkSpark是当今大数据领域最活跃、最热门、最高效的大数据通用计算引擎2009年诞生于美国加州大学伯克利分校AMP 实验室...
- 链接地址:https://blog.csdn.net/chengh1993/article/details/114239397
- 链接标题:【精选】6.2.3 Spark《RDD高阶》序列化,依赖,持久,容错,分区,广播,累加,TopN《原理初》独立作业提交,洗牌原理,RDD优化《SQL概述》数据抽象,类型《SQL编程》SpkSes,DF&DS_CH_ENN的博客-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:247
- 网站标签:6.2.3 Spark《RDD高阶》序列化 依赖 持久 容错 分区 广播 累加 TopN《原理初》独立作业提交 洗牌原理 RDD优化《SQL概述》数据抽象 类型《SQL编程》SpkSes DF&DS