大数据处理框架Hadoop、Spark介绍_大数据 hoodoop 和 s-CSDN博客

网站介绍:文章浏览阅读1.8k次,点赞2次,收藏9次。一、Hadoop简介 Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce。HDFS是一个分布式文件系统:引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。 MapReduce是一个计算框架:MapReduce的..._大数据 hoodoop 和 s