Hive之 hive与hadoop的联系

Hive与Hadoop调用图

解析：

1、提交sql 交给驱动
2、驱动编译：解析相关的字段表信息
3、去metastore查询相关的信息返回字段表信息
4、编译返回信息发给驱动
5、驱动发送一个执行计划交给执行引擎
6、执行计划 (三种形式: metastore、namenode、metastore+namenode+mapreduce)

形式一 > DDL 对数据库表的操作的直接和metastore交互。比如：create table t1(name string);
形式二 > dfs ops 直接和namenode取数据。比如： select * from t1;
形式三 > 把job交给job tracker,让task tracker执行返回执行信息 + 完成job返回数据信息、找namenode查数据。
比如：select * from t1 where col=X ;

7、返回结果信息集

总结： hive 运行在 hadoop 之上，某些操作需要调用 hdfs 中的 mapreduce 。 hive 元数据存储在 matestore 中，而非元数据（如 table 里的数据）存储在hdfs之上。

时间： 2024-10-10 09:19:26

Hive之 hive与hadoop的联系的相关文章

Hive之 hive架构

Hive架构图主要分为以下几个部分: 用户接口,包括命令行CLI,Client,Web界面WUI,JDBC/ODBC接口等中间件:包括thrift接口和JDBC/ODBC的服务端,用于整合Hive和其他程序. 元数据metadata存储,通常是存储在关系数据库如 mysql, derby 中的系统参数底层驱动:包括HiveQL解释器.编译器.优化器.执行器(引擎). Hadoop:用 HDFS 进行存储,利用 MapReduce 进行计算. 用户接口主要有三个:CLI,Client 和

大数据时代的技术hive：hive介绍

我最近研究了hive的相关技术,有点心得,这里和大家分享下. 首先我们要知道hive到底是做什么的.下面这几段文字很好的描述了hive的特性: 1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行.其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析. 2.Hive是建立在 Hadoop

[Hive - LanguageManual] Hive Concurrency Model (待)

Hive Concurrency Model Hive Concurrency Model Use Cases Turn Off Concurrency Debugging Configuration Locking in Hive Transactions Use Cases Concurrency support (http://issues.apache.org/jira/browse/HIVE-1293) is a must in databases and their use case

【hive】——Hive四种数据导入方式

Hive的几种常见的数据导入方式这里介绍四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询出相应的数据并导入到Hive表中:(4).在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中. 一.从本地文件系统中导入数据到Hive表先在Hive里面创建好表,如下: hive> create table wyp > (id int, name string, > age int, tel string) >

[Hive]关于Hive的启动问题

业务背景用户轨迹工程脚本最近经常报错,报错如下: SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory] FAILED: Error in metadata: MetaException(message:java.lang.RuntimeException: commitTransaction was called but openTransactionCalls = 0. This probably indic

Shell脚本执行hive语句 | hive以日期建立分区表 | linux schedule程序

#!/bin/bash source /etc/profile; ################################################## # Author: ouyangyewei # # # # Content: Combineorder Algorithm # ################################################## # change workspace to here cd / cd /home/deploy/rec

【hive】——Hive sql语法详解

Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言查询,汇总,分析数据.而mapreduce开发人员可以把己写的mapper 和reducer 作为插件

【hive】——Hive初始了解

1.没有接触,不知道这个事物是什么,所以不会产生任何问题.2.接触了,但是不知道他是什么,反正我每天都在用.3.有一定的了解,不够透彻.那么hive,1.我们对它了解多少?2.它到底是什么?3.hive和hadoop是什么关系?扩展:hbase和hive是什么关系? Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的需求而产生和发展的.那么,到底什么是Hive,我们先看看Hive官网Wiki是如何介绍Hive的(https://cwiki.apache.org/c

Hive 官方手册翻译 -- Hive Transactions (Hive 事务)

由 Alan Gates创建, 最终由 Andrew Sherman修改于2018年8月7日原文链接:https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions 翻译:Google Google翻译,金山软件金山词霸校对:南大通用范振勇 (如有翻译问题,请多指教) 一.Hive 3的警告升级到Hive 3.0时,由之前版本创建的任何事务性表都需要在每个分区上运行Major(主要/深度)级紧缩操作.更确切地说,自上

hive (一) ----- hive的安装和使用

一.hive安装 1.下载hive2.1-tar.gz 2.解压 tar -zxf hive-2.1.0.tar.gz -C /opt cd /opt ln -s hive-2.1.0 hive 3.配置环境变量 [/etc/profile] HIVE_HOME=/soft/hive PATH=...:$HIVE_HOME/bin 测试: hive --version hive --help 4.复制mysql驱动程序到hive的lib目录下. 5.配置hive 1)复制hive-default

猜你喜欢

Node.js异步IO

为什么要异步I/O? 从用户体验角度讲,异步IO可以消除UI阻塞,快速响应资源 JavaScript是单线程的,它与UI渲染共用一个线程.所以在JavaScript执行的时候,UI渲染将处于停顿的状态 ...

HTML5里面的快捷键

基本的快捷键编辑菜单 Alt + E 文件菜单 Alt + F 视图菜单 Alt + V 全选文本 Ctrl + A 复制文本 Ctrl + C 查找文本 Ctrl + F 查找替换文本 Ctrl ...

动态规划--青蛙跳

Description 在河上有一座独木桥,一只青蛙想沿着独木桥从河的一侧跳到另一侧.在桥上有一些石子,青蛙很讨厌踩在这些石子上.由于桥的长度和青蛙一次跳过的距离都是正整数,我们可以把独木桥上青蛙可能 ...

认识Java虚拟机的内部体系结构

认识Java虚拟机的内部体系结构 Java虚拟机的内部体系结构也许很少有人去关心,因为对于Java程序员来说,一般只需要跟API打交道就可以了.这些体系结构只是Java虚拟机内部的结构而已.但是如果理 ...

redis（1）

安装redis wget http://download.redis.io/releases/redis-3.0.7.tar.gz tar xzf redis-3.0.7.tar.gz ln -s r ...

hdu 2516 FIB博弈

分析请看:cxlove 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include ...

洛谷 P1576 最小花费 dijkstar

P1576 最小花费题目背景题目描述在n个人中,某些人的银行账号之间可以互相转账.这些人之间转账的手续费各不相同.给定这些人之间转账时需要从转账金额里扣除百分之几的手续费,请问A最少需要多少钱使 ...

js中字符串和数组相互转化的方法

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px "Helvetica Neue"; color: #e4af0a } p. ...

二叉查找树中元素的删除操作

关于二叉查找树的建立,插入,遍历(记住二叉查找树的中序遍历是所有元素由大到小排序结果)等操作,博主“C小加”写的很详细了,我主要补充二叉树的删除操作.删除操作主要难在对左右子节点都非空的节点的删除操作 ...

nginx搭建图片服务器

http_image_filter_module是nginx提供的集成图片处理模块,支持nginx-0.7.54以后的版本,在网站访问量不是很高磁盘有限不想生成多余的图片文件的前提下可,就可以用它实时 ...

Frameworks detected: Android framework is detected in the project

在Github上下载源码在Android Studio打开运行这个问题,在StackOverFlow里有多个不同解决方法,地址在这里, 可以按着上面的方法试试,这里记录一下解决了我问题的解决方法: M ...

FJNU 1154 Fat Brother And His Love（胖哥与女神）

FJNU 1154 Fat Brother And His Love(胖哥与女神) Time Limit: 2000MS Memory Limit: 257792K [Description] [ ...

Java总结篇系列：Java多线程（二）

四.Java多线程的阻塞状态与线程控制上文已经提到Java阻塞的几种具体类型.下面分别看下引起Java线程阻塞的主要方法. 1.join() join -- 让一个线程等待另一个线程完成才继续执行. ...

[转]机器学习经典书籍

算法组注册登录机器学习经典书籍机器学习 machine-learning 书单你已经选择了 0 个帖子. 全选取消选择 1 / 6 sys 14-12-9 5 选择以及回复其的帖子选择 ...

表单验证和正则表达式

表单验证: 一.非空验证: 1.内容是不是空的. 判断值的长度是不是0.length属性. 2.内容是不是改变了. 二.对比验证: 1.验证两个控件值的关系(相同,大小) 2.验证控件的值与某个固定值 ...

js 添加节点dom

var elemet = document.createElement("p"); var attr=document.createAttribute("align&qu ...

NBUT 1641 “错误的算法”（这是题目名）

题目: Description 有道题目是这样的: 输入一个n行m列网格,找一个格子,使得它所在的行和列中所有格子的数之和最大.如果答案不唯一,输出任意解即可.比如,在下面的例子中,最优解是(1,3) ...

WinForm下ComboBox设定SelectedValue总结 (SelectedValue==null解决办法)[转]

http://www.cnblogs.com/qqflying/archive/2013/05/23/3096050.html 实践发现:以SelectedIndex赋值让ComboBox自动选中时能 ...

[Android Pro] Android API 23中废弃了HttpClient的解决办法

reference to : http://blog.csdn.net/hbwindy/article/details/51326019 reference to : http://blog.csdn ...

馨梦ASP服务器|馨梦ASP服务器V2017.7官方版下载

默认网页地址为程序路径的web目录,默认打开企业宣传页面,您可通过http://127.0.0.1/web打开您的项目. 内置退出标记.可以方便的和各类软件结合令软件退出. 特别适用于各政企医疗机构触 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.