spark简单API入门-CSDN博客网友收藏

spark简单API入门-CSDN博客

在Spark 2.0之前,Spark的主要编程接口是弹性分布式数据集(RDD)。在Spark 2.0之后,RDD被数据集取代,数据集类似于RDD一样强类型,但在底层有更丰富的优化。Spark的shell用来学习API启动命令:./bin/spark-shellSpark的主要抽象是一个名......
阅读全文