大数据系列 : Spark初探_spark 大数据系列-CSDN博客

网站介绍:文章浏览阅读1.1k次。什么是Spark官网介绍Apache Spark™是用于大规模数据处理的统一分析引擎。Spark诞生于U.C Berkeley的AMPLab , 它是这个世界上最重要的分布式大数据框架之一。它扩展了广泛使用的MapReduce计算模型。高效地支撑更多计算模型 , 包括交互式查询和流处理。Spark的一个主要特点是能够在内存中进行计算 , 即使依赖磁盘进行复杂的运算 , Spark依..._spark 大数据系列