这个机制不一样.在oracle中,如果你count某一列,应该是仅仅加载这一列,如果有索引啥的,直接在索引上统计了,当然很快.(如果你countvarchar非常大之类的字段,速度应该会非常慢)但是hive的cunt是基于hadoop的mr任务的,还是读取每一行的所有的数据,如果你每行中有类似于clob之类的列的话,io的开销可想而知.另外mr任务的启动也是需要时间的.另外就是和你的hadoop的数据节点多少有关。
@missli
顶0
加入收藏
相关问答推荐
加入收藏