文章浏览阅读2.3k次。HBase是基于谷歌Bigtable开发的开源分布式数据库,具有高可靠、高性能、面向列、可伸缩等特点。HBase一般运行在HDFS上,主要用来存储非结构化和半结构化数据。HBase通过水平扩展的方式实现大表数据(表的......
2024-01-24 07:22 阅读 阅读全文文章浏览阅读2.3k次。HBase是基于谷歌Bigtable开发的开源分布式数据库,具有高可靠、高性能、面向列、可伸缩等特点。HBase一般运行在HDFS上,主要用来存储非结构化和半结构化数据。HBase通过水平扩展的方式实现大表数据(表的......
2024-01-24 07:22 阅读 阅读全文文章浏览阅读108次。14 泛型泛型目的是为例增加类型的约束,提高程序的健壮性。泛型和类型的关系泛型和类型没有直接关系,但是类型标识对外部类型的数据约束。泛型主要用于对内部数据类型的约束。14.1 泛型不可变object Sca......
2024-01-23 21:59 阅读 阅读全文文章浏览阅读195次。当旧业务需要改造为基于 dble 的分布式业务时,会面临已有历史数据的拆分和导入问题,dble 支持的导入导出方式有多种,具体详见文档3.11.1,本次我们介绍的 split 功能可以理解为导入过程加速器,那它是怎......
2023-11-11 14:57 阅读 阅读全文文章浏览阅读300次。文章目录1.分布式文件系统HDFS1.HDFS的来源2.HDFS的架构图之基础架构2.1 master/slave 架构2.2 名字空间(NameSpace)2.3 文件操作2.4副本机制2.5心跳机制2.6 一次写入,多次读出3.NameNode与Datanode的总结概述3.1namenode 元数......
2024-01-22 16:32 阅读 阅读全文文章浏览阅读1.4k次,点赞2次,收藏14次。MapReduce分布式计算MapReduce分布式计算前期准备MapReduce的圆周率计算方法MapReduce的Wordcount计算方法MapReduce的正则表达式匹配计算方法MapReduce分布式计算前期准备1.启动Hadoop./sbin/start-dfs.sh2.在......
2024-01-21 12:52 阅读 阅读全文文章浏览阅读3.3w次。大数据产品评测 2018年11月30日,为期两天的数据中心联盟第七批大数据产品评测结果评审会圆满结束。上海爱可生信息技术股份有限公司作为本次评测企业单位,提供的分布式数据库系统软件“云树®Shard”......
2023-11-11 14:55 阅读 阅读全文文章浏览阅读904次。实际测评一探究竟我们知道,分布式存储服务器相对于传统存储来说。系统本身采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用......
2024-01-23 09:24 阅读 阅读全文文章浏览阅读1.3k次。RDD和共享变量是Spark中的两个重要抽象。RDD弹性分布式数据集, 是分布式内存的一个抽象概念,RDD提供了一种高度受限的共享内存模型,即RDD是只读的记录分区的集合,只能通过在其他RDD执行确定的转换操......
2024-01-23 23:09 阅读 阅读全文