hive调优是比较大的专题,需要结合实际的业务,数据的类型,分布,质量状况等来实际的考虑如何进行系统性的优化,hive底层是mapreduce,所以hadoop调优也是hive调优的一个基础,hvie调优可以分为几个模块进行考虑,数据的压缩与存储,sql的优化,hive参数的优化,解决数据的倾斜等。

发布于 2021-04-23 17:04:24
【多选题】
A 请慎重使用COUNT(DISTINCT col) 和select *
B 小文件会造成资源的多度占用以及影响查询效率
C 不要在表关联后面加WHERE条件
D 处理掉字段中带有空值的数据
E 设置并行执行任务数
F 设置合理的Reducer个数
G 选择使用严格模式

查看更多

关注者
0
被浏览
211
  • 体验AI问答!更聪明、超智能!
  • 一款基于GPT的超级AI助手,可以对话、创作、写文案!
1 个回答

撰写答案

请登录后再发布答案,点击登录

发布
问题

手机
浏览

扫码手机浏览

分享
好友

在线
客服