[大数据]spark(1)环境搭建_大数据之spark简介与环境搭建-CSDN博客

网站介绍:文章浏览阅读311次。1.Spark概述1.1 SparkSpark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。1.2 Spark历史1.3 Spark内置模块Spark Core:实现了Spark的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含了对弹性分布式数据集(Resilient Distributed DataSet,简称RDD)的API定义。Spark SQL:是Spark用来操作结构化数据的程序包。通过Spark SQL,我们可以使用 S_大数据之spark简介与环境搭建