2.Hadoop 生态圈及核心组件简介_hadoop_墨家先生-华为云开发者联盟

网站介绍:1.Hadoop 生态圈Hadoop是目前应用最为广泛的分布式大数据处理框架,其具备可靠、高效、可伸缩等特点。Hadoop的核心组件是HDFS、MapReduce。随着处理任务不同,各种组件相继出现,丰富Hadoop生态圈,目前生态圈结构大致如图所示:根据服务对象和层次分为:数据来源层、数据传输层、数据存储层、资源管理层、数据计算层、任务调度层、业务模型层。1.1.HDFS(分布式文件系统)HDF 墨家先生 华为云开发者联盟