Hive,SQL,MapReduce,Hadoop,Spark等这些关系及理解_谈谈mapreduce、pig、hive这三个组件的理解-CSDN博客

网站介绍:文章浏览阅读5.2k次,点赞9次,收藏33次。由于数据量巨大,单机无法存储,所以我们需要将用很多台机器存储数据,HDFS(Hadoop Distributed FileSystem)就应用而生,它是专门负责管理这么多台单机之间的数据,你存取数据都是和单机一样的操作流程,但实际上这些数据都是在多台单机上存储的,相当于HDFS是一个帮你管理大数据的界面,你不用管它后面是怎么的关系,只需要在它这儿操作就可以了。光有数据也不行啊,数据我们是要..._谈谈mapreduce、pig、hive这三个组件的理解