hive如何执行一条sql的例子

SQL如何在Mapreduce执行

左边是数据表，右边是结果表，这条 SQL 语句对 age 分组求和，得到右边的结果表，到底一条简单的 SQL 在 MapReduce 是如何被计算， MapReduce 编程模型只包含 map 和 reduce 两个过程，map 是对数据的划分，reduce 负责对 map 的结果进行汇总。

select id,age,count(1) from student_info group by age

首先看 map 函数的输入的 key 和 value，输入主要看 value，value 就是 user_info 表的每一行数据，输入的 value 作为map函数输出的 key，输出的 value 固定为 1，比如<<1,17>,1>。 map 函数的输出经过 shuffle 处理，shuffle 把相同的 key 以及对应的 value 组合成新<key,value集合>，从 user_info 表看出map输出 2 次<<1,17>,1>，那么经过 shuffle 处理后则会输出<<1,17>,<1,1>>，并将输出作为 reduce 函数的输入。

在 reduce 函数会把所有 value 进行相加后输出结果，<<1,17>,<1,1>>输出为<<1,17>,2>。这就是一条简单 SQL 在 Mapreduce 执行过程，可能你会有点迷糊，在这里我画了一张流程图，结合流程图你会更加清楚。

https://www.cnblogs.com/TFengStorm/p/10198853.html

原文地址：https://www.cnblogs.com/zourui4271/p/10200597.html

时间： 2024-11-13 09:27:05

hive如何执行一条sql的例子的相关文章

执行一条sql语句update多条记录实现思路

执行一条sql语句update多条记录实现思路如果你想更新多行数据,并且每行记录的各字段值都是各不一样,你会怎么办呢?本文以一个示例向大家讲解下如何实现如标题所示的情况,有此需求的朋友可以了解下通常情况下,我们会使用以下SQL语句来更新字段值: UPDATE mytable SET myfield='value' WHERE other_field='other_value'; 但是,如果你想更新多行数据,并且每行记录的各字段值都是各不一样,你会怎么办呢?举个例子,我的博客有三个分类目录(免

执行一条sql语句update多条不同值的记录实现思路

如果你想更新多行数据,并且每行记录的各字段值都是各不一样,你会怎么办呢?本文以一个示例向大家讲解下如何实现如标题所示的情况,有此需求的朋友可以了解下通常情况下,我们会使用以下SQL语句来更新字段值: 复制代码代码如下: UPDATE mytable SET myfield='value' WHERE other_field='other_value'; 但是,如果你想更新多行数据,并且每行记录的各字段值都是各不一样,你会怎么办呢?举个例子,我的博客有三个分类目录(免费资源.教程指南.橱窗展示

执行一条cmd命令的window.bat 批处理代码：

. .执行一条cmd命令的window.bat 批处理代码: @echo off echo NodeJS SUPERVISOR...Server.js ::下面是批处理代码 supervisor d:\WWWBOX\LEAPNODE\server.js ::暂停 3 秒时间 ping -n 3 127.0.0.1 > nul ::暂停 ::pause Exit // 执行启动Nginx-php-mysql的 window 批处理代码 @echo off echo Starting PHP Fas

执行一次SQL查询，修改UPDATE多行记录

通常情况下,我们会使用以下SQL语句来更新字段值: UPDATE mytable SET myfield='value' WHERE other_field='other_value';UPDATE mytable SET myfield='value' WHERE other_field='other_value'; 但是,如果你想更新多行数据,并且每行记录的各字段值都是各不一样,你会怎么办呢?举个例子,我的博客有三个分类目录(免费资源.教程指南.橱窗展示),这些分类目录的信息存储在数据库表c

php执行一条insert插入两条数据其中一条乱码

显然这就是编码问题,但是问题从哪来的呢, 我把文件编码以及代码的编码都设置成utf-8了,为什么还有这个问题于是我就开始写测试脚本第一条 mysql_query('insert into table value(1,1,"思考思考123")') 测试没有问题第二条 $name=$_GET["name"]; mysql_query('insert into table value(1,1,"'.$name.'")') 测试出问题了,数据库竟然插

C#先执行一段sql等后台操作后再提示是否后续操作confrim

应用场景:例如选择一个单据号打击打印后先去数据库检索是否有打打印过,如果有则提示,已打印,是否再打如果没有则不提示,直接进行打印. 实现原理:多做一个隐藏按钮去实现打印功能,页面上的打印按钮则进行数据库的后台操作,跟据取出的数据可以在后台直接调用打印,或用脚本调用前台confirm 代码Demo: 后台: using System; using System.Collections.Generic; using System.Linq; using System.Web; using Sys

MySQL的诡异同步问题-重复执行一条relay-log

MySQL的诡异同步问题近期遇到一个诡异的MySQL同步问题,经过多方分析和定位后发现居然是由于备份引发的,非常的奇葩,特此记录一下整个问题的分析和定位过程. 现象同事扩容的一台slave死活追不上同步,具体的现象是SBM=0,但是Exec_Master_Log_Pos执行的位置和Read_Master_Log_Pos完全对不上,且服务器本身CPU和IO都消耗的非常厉害. ——total-cpu-usage---- -dsk/total- -net/total- ---paging-- --

Oracle删除一条SQL在Shared Pool里缓存的执行计划的三种方法

在Oracle里第一次执行一条SQL语句后,该SQL语句会被硬解析,而且执行计划和解析树会被缓存到Shared Pool里.方便以后再次执行这条SQL语句时不需要再做硬解析,方便应用系统的扩展.但是如果该SQL对应的表数据量突变或其他原因,Shared Pool里缓存的执行计划和解析树已经不再适用于现在的情况,SQL执行效率急速下降,这种情况下就需要把该SQL缓存在Shared Pool里的执行计划和解析树清理出去,以便对该SQL重新做硬解析,生成新的执行计划和解析树. 从Shared Pool

mysql -- 一次执行多条sql语句

最近要做一个软件升级,其中涉及到数据库表字段的变动(新增或删除或修改),所有的关于数据库的变动的sql语句都是存放在Sqlupdate.sql文件中,每次升级的时候都需要执行一次Sqlupdate.sql里的所有sql语句,这就涉及到执行多条语句的问题了.软件在CodeIgniter框架上开发的,CodeIgniter有封装好的执行sql语句的函数:$this->db->query('****'),但此函数一次只能执行一条sql语句.所以得另外想办法了.百度了下,找到了一些资料.multi_q

猜你喜欢

【网络爬虫】微信公众号采集

# WeixinCrawler 根据搜狗搜索关键词采集微信公众号和相应推文采集策略:深度搜索采集核心代码: package main; import java.io.File; import ...

WaitForSingleObject用法

对应函数编辑 VC声明 DWORD WaitForSingleObject( HANDLE hHandle, DWORD dwMilliseconds ); 参数编辑 hHandle[in]对象句 ...

作业7--南通大学教务系统体验分析

关于南通大学教务管理系统,用的地方还是挺多的,比如选课,查个人成绩,查课表,重修报名等等,跟学生的学习生活联系密切,所以综合个人的使用情况,我在此做一些用户体验评价.首先是排版,下面就是一张主页图 ...

tkinter学习三

配置组件外观(Configuring Widget Appearance) from tkinter import * root = Tk() labelfont = ('times', 20, 'b ...

Andriod四种存储——SharedPreferences

SharedPreferences是Android平台上一个轻量级的存储接口,用来保存应用的一些常用配置,比如Activity状态,Activity暂停时,将此Activity的状态保存到Shared ...

LVS集群十种调度算法及负载均衡理论

一.LVS概念 LVS(Linux Virtual Server):Linux 虚拟server: LVS是个负载均衡设备.它不提供不论什么服务.用户请求到这里的时候.它是将客户需求转发至后端真正提供 ...

zabbix 3.0 监控windows 部署

下载客户端 http://www.zabbix.com/downloads/3.0.4/zabbix_agents_3.0.4.win.zip 在c盘里创建一个zabbix文件夹,便于后面的管理.把下 ...

学好C++必须要注意的十八个问题

转自: 学好C++必须要注意的十八个问题一.#include "filename.h"和#i nclude <filename.h>的区别 #include &quo ...

WSS（Windows Storage Server）2008R2使用指南（三）配置及使用篇

WSS2008专题内容: WSS(Windows Storage Server)2008R2使用指南(一)下载篇 WSS(Windows Storage Server)2008R2使用指南(二)安装篇 ...

P2038 无线网络发射器选址

P2038 无线网络发射器选址题目描述随着智能手机的日益普及,人们对无线网的需求日益增大.某城市决定对城市内的公共场所覆盖无线网. 假设该城市的布局为由严格平行的129 条东西向街道和129 条南 ...

分页过滤SQL求总条数SQL正则

public static void main(String[] args) throws Exception { String queryForScanUsers_SQL = "selec ...

wait, notify, sleep, join, interrupt

学习多Thread编程,对这几个方法的理解非常重要,然而他们却难以掌握.今天就专门看了看API,下面进行简短的说明: synchronized 在学习这几个方法前,先要明白synchronized的用 ...

mysql主主互备+原来mysql主从架构

接http://wsw26.blog.51cto.com/1442148/1749125我这个A已做了BC的主架构上增加一台D的虚拟机(同一个环境),我的目的是D和A主主互备,BC继续做A的从,既是D ...

MYSQL主从复制与读写分离（MariaDB)

MYSQL主:192.168.26.210(centos6.6,Mariadb10) MYSQL从:192.168.26.211(centos6.6,Mariadb10) 读写分离器mysql-pro ...

一张图看从CreateProcess到main函数的过程

整体过程如下: 需要说明两点: 1．在XP中,新进程主线程的启动,会先执行一个用户态的APC,会执行ntdll!LdrInitializeThunk进行程序执行前的一些列初始化操作.其中很重要任务就是 ...

选购流程

在自由空间上成功创建应用后,您可以为您的应用选购所需的各类服务和数据. Step1:进入“自助中心”首页 Step2:点击具体应用的图标,进入到应用具体页面,点击“添加服务” Step3:选购所需 ...

JS json的使用

json的定义 json能够通过4种基本数据类型以及2种结构化数据表示字符串 "footbar" 不能使用单引号数值 125.4 只支持10进制布尔 true false ...

Android自定义视图三：给自定义视图添加“流畅”的动画

在第二部分我们实现了一个简单的折线图.这里假设你已经读了前篇.下面我们将继续为这个折线图添砖加瓦. 我在想给这个图的上方添加三个按钮,这样用户可以点选不同的按钮来查看不同类别的数据.比如,用户可以查看 ...

cmd下查看端口被某程序占用命令

假如我们需要确定谁占用了我们的9050端口 1.Windows平台在windows命令行窗口下执行: C:\>netstat -aon|findstr "9050" TCP ...

Python基础3 函数、递归、内置函数

本节内容 1. 函数基本语法及特性 2. 参数与局部变量 3. 返回值嵌套函数 4.递归 5.匿名函数 6.函数式编程介绍 7.高阶函数 8.内置函数温故知新 1. 集合主要作用: 去重关系测 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.025 s.