通过hive自带的server2的thrift模式提交的sql可以获得状态进度,jdbc方式没有试过.其实,我们完全可以不使用hive,sql-on-hadoop的框架有ibm的bigsql,apache的dirll,impala等都是非常不错的,都可以替代hive.速度都比hive要快很多.偶理解hive只是提供查询和数据处理功能的(解析hiveql语句为mapreduce任务),不负责数据存储的.数据存储应该是hbase和hdfs的功能,hbase是keyvalue的存储方式,适用于固定列查询的数据,如果查询方式多样复杂,感觉应该是使用hdfs存储,然后使用hive进行查询和处理。
@miss
顶0
加入收藏
相关问答推荐