有点不太明白你的意思,我只按照我自己的理解说了一般hive表应该建立一个以day(每一天,比如day=20141227,代表2014-12-27的数据)作为分区,每一天都存一个分区,这个如果想统计7天的你可以再shell中得到今天作为变量,然后往前推7天那一天作为变量,这两个变量就可以写个sqlselect*fromtablenamewhereday=sevenbeforeday如果你想从关系型数据库中导出七个表到hive,就每一天作为分区。
@content
顶0
加入收藏
相关问答推荐