05-SparkRDD原理和编程接口_sparkrdd程序设计 给定数据文件:test.txt(把这个文件上传到master上) 编写代码-CSDN博客网友收藏

05-SparkRDD原理和编程接口_sparkrdd程序设计 给定数据文件:test.txt(把这个文件上传到master上) 编写代码-CSDN博客

文章浏览阅读644次。1.弹性分布式数据集RDD1.1.RDD概述1.1.1.什么是RDDRDD(Resilient Distributed DataSet)弹性分布式数据集。是spark中最基本的数据抽象,是一个不可变的、可分区的、可并行计算的集合。Resilient:数据可以选择性的存储......
阅读全文
Spark分布式集群环境搭建_spark完全分布式集群采用主从模式,即其中一台机器作为主节点master,其他的机-CSDN博客网友收藏

Spark分布式集群环境搭建_spark完全分布式集群采用主从模式,即其中一台机器作为主节点master,其他的机-CSDN博客

文章浏览阅读4w次,点赞23次,收藏154次。一、平台环境虚拟机:VMware Workstation Pro 64位操作系统:Ubuntu16.04 64位二、 软件包Jdk-8u171-linux-x64.tar(java version 1.8.0_171)Hadoop 2.9.1.tarScala-2.11.6Spark-2.3.1-bin-hadoop2.7三、Spark分布式集群环境搭建......
阅读全文