离线数仓建设及技术选型_离线计算技术选型-CSDN博客

网站介绍:文章浏览阅读1k次。主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。整合企业业务数据,建立统一的数据中心;产生业务报表,了解企业的经营状况;为企业运营、决策提供数据支持;可以作为各个业务的数据源,形成业务数据互相反馈的良性循环;分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果;开发数据产品,直接或间接地为企业盈利;➢ 数据采集传输:Flume,Kafka,Sqoop➢ 数据存储:MySql,HDFS(公司有云存储最好是上云)➢ 数据计算:Hive,Tez_离线计算技术选型