大数据之hadoop中的序列化_hadoop自定义序列化 重写序列化方法的作用-CSDN博客

网站介绍:文章浏览阅读1.6k次。1、概述MapReduce 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的 分布式运算程序,并发运行在一个 Hadoop 集群上。 优点:易于编程(用户只关心业务逻辑即可)、良好的扩展性(可以动态增加服务器)、高容错性(任意一台机器挂掉,可以将任务转移到另一节点)、适合海量数据计算(PB/BP) 缺点:不擅长实时计算、不擅..._hadoop自定义序列化 重写序列化方法的作用