Hive面试准备

Hive与HBase的区别
Hive架构原理
Hive的数据模型及各模块的应用场景
Hive支持的文件格式和压缩格式及各自特点
Hive内外表的区分方法及内外部差异
Hive视图如何创建、特点及应用场景
Hive常用命令及作用
Hive常用的10个系统函数及作用
简述UDF/UDAF/UDTF是什么,各自解决问题及应用场景
Hive设置配置参数的方法,列举8个常用配置
Hive数据倾斜的原因及主要解决方法
Hive优化策略
向Hive中传入变量的方式
Hive动态分区
Hive手写SQL案例
Hive分析窗口函数

原文地址:https://www.cnblogs.com/sx66/p/12039149.html

时间: 2024-11-06 11:41:42

Hive面试准备的相关文章

#IT明星不是梦#Hive面试总结

1.Hive导出数据有几种方式?如何导出数据 (1)insert 导出本地: insert overwrite local directory '本地路径' select * from 表名; 导出到HDFS: insert overwrite directory 'hdfs路径' select * from 表名; (2)hadoop命令 hdfs dfs -get /user/hive/warehouse/student/student/txt /opt/bigdata/data (3)Ba

hive入门学习线路指导

转自:http://www.aboutyun.com/thread-7598-1-1.html hive被大多数企业使用,学习它,利于自己掌握企业所使用的技术,这里从安装使用到概念.原理及如何使用遇到的问题,来讲解hive,希望对大家有所帮助.此篇内容较多:看完之后需要达到的目标1.hive是什么2.明白hive的原理3.会使用hive4.会使用hive编程 1.hive首先我们需要hive是什么?让你真正明白什么是hive上面讲的很明白1.hive是一个数据仓库2.hive基于hadoop.总

零基础学习hadoop到上手工作线路指导初级篇:hive及mapreduce

此篇是在零基础学习hadoop到上手工作线路指导(初级篇)的基础,一个继续总结.五一假期:在写点内容,也算是总结.上面我们会了基本的编程,我们需要对hadoop有一个更深的理解:hadoop分为hadoop1.X.hadoop2.X,并且还有hadoop生态系统.这里只能慢慢介绍了.一口也吃不成胖子. hadoop 1.x分为mapreduce与hdfs 其中mapreduce是很多人都需要迈过去的槛,它比较难以理解,我们有时候即使写出了mapreduce程序,但是还是摸不着头脑.我们不知道ke

零基础学习hadoop到上手工作线路指导(中级篇)

此篇是在零基础学习hadoop到上手工作线路指导(初级篇)的基础,一个继续总结. 五一假期:在写点内容,也算是总结.上面我们会了基本的编程,我们需要对hadoop有一个更深的理解: hadoop分为hadoop1.X.hadoop2.X,并且还有hadoop生态系统.这里只能慢慢介绍了.一口也吃不成胖子. hadoop 1.x分为 mapreduce与hdfs其中mapreduce是很多人都需要迈过去的槛,它比较难以理解,我们有时候即使写出了mapreduce程序,但是还是摸不着头脑. 我们不知

面试:Hbase和Hive的区别

区别: 1. Hive是一个构建在Hadoop基础设施之上的数据仓库,通过HQL查询存放在HDFS上的数据,不能交互查询.HBase是一种Key/Value系统,它运行在HDFS之上,可以交互查询. 2. Hive只是一种类SQL的引擎,运行MapReduce任务,不能更新数据.Hbase是一种在Hadoop之上的NoSQL 的Key/vale数据库,可以增删改查. 3. Hive表的创建类似MySQL,需要定义表和列.Hbase的schema仅仅有表格和列簇就足够了. 4. Hive适合离线分

Hive学习01-快速了解hive以及常见的面试问题

cloudera公司发行的CDH中 hive的有三种角色:gateway.hiveserver2.hive metastore三种角色其中hive metastore主要用于客户端连接 默认端口hive server2 主要用于jdbc连接(很多bi产品都靠jdbc连接,比如hue,帆软等软件)gateway 是client的一个代理,主要用于更新hive的客户端配置 apache社区的hive中也分为客户端,hiveserver2和hive metastore启动 metastore : hi

Java面试汇总

转自:http://zy19982004.iteye.com/blog/1846537#comments 一.All 最近找工作,遇到的笔试面试题,归纳如下,供大家参考. 二.J2SE 容器 HashMap,LinkedHashMap,TreeMap的实现,算法时间复杂度. HashSet,LinkedHashSet,TreeSet的实现. ArrayList,LinkedList的实现.某公司机试:自己实现一个List. 同步容器.java.util.Collections类. 多线程 多线程

2018年前100名Apache Spark面试问题和解答(上)

我们知道Apache Spark现在是一项蓬勃发展的技术.因此,了解Apache Spark的各个方面以及Spark面试问题非常重要.我将介绍Spark的每个方面,这也可能是经常被问到的Spark面试问题.此外,我将尽力提供每个问题,从现在开始,您搜索最佳和所有Spark面试问题将在此结束. Apache Spark面试问题答案 一,什么是Apache Spark? Apache Spark是一个功能强大的开源灵活数据处理框架,围绕速度,易用性和复杂的分析而构建.Apache Spark在集群计

面试记录-KPMG(毕马威)

今天接到了KPMG的电话面试. 首先是英文自我介绍,很easy,简单略过. 接下来是技术面.问了一些技术问题. 1. hadoop有没有搭过环境?(我回答搭过)讲下搭建过程? 答:先是配置网络,关闭防火墙等等,然后下载hadoop安装包,解压,配置core-site.xml,hdfs-site.xml等配置文件,然后分发到各节点,命令启动即可.-------------面试官:嗯~ 2. hive用过吗?  答:没用过(面试官没再继续问,后来知道,他那边主要就是用Hive)   3. hbase