day 46 hive 分区/桶 JDBC 数据类型 开窗函数(连续登陆问题,top N)_hive 开窗算连续30天-CSDN博客

网站介绍:文章浏览阅读784次。文章目录一、分区1、分区2、动态分区3、多级分区(多级子目录)二、分桶三、Hive JDBC四、一些数据类型1、基本数据类型2、时间类型3、复杂数据类型1 array2 map3 struct4、行、列转换1 行转列2 列转行五、开窗函数总结I know, i know地球另一端有你陪我一、分区1、分区实际上是在表的目录下在以分区命名,建子目录作用:能够避免全表扫描,减少MapReduce处理的数据量,提高效率需要在建表时加上分区字段,通常按日期、地域分区,一般不超过三级目录,_hive 开窗算连续30天