hive是建立在hadoop上的数据仓库基础构架.它提供了一系列的工具,可以用来进行数据提取转化加载(etl),这是一种可以存储、查询和分析存储在hadoop中的大规模数据的机制.hive定义了简单的类sql查询语言,称为hql,它允许熟悉sql的用户查询数据.同时,这个语言也允许熟悉mapreduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作.hive采用类sql的查询方式,将sql查询转换为mapreduce的job在hadoop集群上执行。
@kuigang
顶0
加入收藏
相关问答推荐