Spark学习笔记_saveastextfile()将数据以文本格式输出到文件系统的指定目录,saveasobjectf-CSDN博客

网站介绍:文章浏览阅读4.2k次,点赞2次,收藏8次。本文整理自《Spark快速大数据分析》,其中SparkSQL和SparkStreaming还没学习,日后补上第二章 Spark入门RDD(弹性分布式数据集)是Spark对分布式数据和计算的基本抽象。每个Spark应用都有一个驱动器程序来发起集群上的并行操作。驱动器程序包含应用的main函数,并且定义了集群上的分布式数据集,还对数据集应用了相关操作。驱动器程序一般要管理多个执行器_saveastextfile()将数据以文本格式输出到文件系统的指定目录,saveasobjectfil