Hive中分区表和分桶表的区别:

发布于 2021-04-23 17:04:26
【多选题】
A 从表现形式上:分区表是一个目录,分桶表是文件
B 从创建语句上: 分区表使用partitioned by 子句指定,以指定字段为伪列,需要指定字段类型 分桶表由clustered by 子句指定,指定字段为真实字段,需要指定桶的个数
C 从数量上: 分区表的分区个数可以增长,分桶表一旦指定,不能再增长
D 从作用上: 分区避免全表扫描,根据分区列查询指定目录提高查询速度 分桶保存分桶查询结果的分桶结构(数据已经按照分桶字段进行了hash散列)。 分桶表数据进行抽样和JOIN时可以提高MR程序效率

查看更多

关注者
0
被浏览
77
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服