spark中RDD算子介绍_spark rdd window算子-CSDN博客

网站介绍:文章浏览阅读3.5k次。1. spark简介Spark可以用于批处理、交互式查询(Spark SQL)、实时流处理(Spark Streaming)、机器学习(Spark MLlib)和图计算(GraphX)。Spark是MapReduce的替代方案,而且兼容HDFS、Hive,可融入Hadoop的生态系统,以弥补MapReduce的不足。2. RDD简介RDD(Resilient Distributed D..._spark rdd window算子