hive 分组排序，topN

语法格式：row_number() OVER (partition by COL1 order by COL2 desc ) rank
partition by：类似hive的建表，分区的意思；
order by ：排序，默认是升序，加desc降序；
rank：表示别名
表示根据COL1分组，在分组内部根据 COL2排序，而此函数计算的值就表示每组内部排序后的顺序编号（组内连续的唯一的)

-- 分组排序
-- 求某用户日期最大的3天
select a.* from(
select p_day,muuid,row_number() over(partition by muuid order by p_day) rank
from test
group by p_day,muuid)a
where a.rank <=3;
---- 获取每天充值数的前3名
select * from(
select p_day,muuid,c row_number over(partition by p_day order by p_day,c desc) ord
from(
select p_day,muuid,count(1) c from test where p_day>‘2017-09-09‘
group by p_day,muuid
) t1
)t2
where ord <= 3;

时间： 2024-10-11 13:18:55

hive 分组排序，topN的相关文章

hive分组排序函数分组取top10

hive分组排序函数分组取top10 语法:row_number() over( partition by 字段a order by 计算项b desc) rank --这里rank是别名 Partition by:类似hive的建表,分区的意思这里按字段a分区,对计算项b进行降序排序实例: 要取top10品牌,各品牌的top10渠道,各品牌的top10渠道中各渠道的top10档期 1) 取top10品牌 Select 品牌,count/sum/其他() as num from tb_na

Hive分组取Top N

Hive在0.11.0版本开始加入了row_number.rank.dense_rank分析函数,可以查询分组排序后的top值说明: row_number() over ([partition col1] [order by col2]) rank() over ([partition col1] [order by col2]) dense_rank() over ([partition col1] [order by col2]) 它们都是根据col1字段分组,然后对col2字段进行排序,

本地化下按首字母分组排序的神器——UILocalizedIndexedCollation

最近在整一个很简单的通讯录相关的项目,通讯录当然就少不了按首字母或者汉字拼音首字母分组排序索引.因为按照我一贯的的做法,都是想要做成更通用的.支持本地化的,所以这就纠结了,世界各地的语言啊我去,我顶多也就认识中文和英语,这就不能用以前的那些比如把汉字转成拼音再排序的方法了,效率不高不说,对其他国家的本地化更是行不通.一个偶然的机会,我才发现SDK里已经提供了一个实现此功能的神器——UILocalizedIndexedCollation. 首先提一下,UILocalizedIndexedColla

MYSQL-实现ORACLE 和SQLserver数据中- row_number() over(partition by ) 分组排序功能

网上看见了好多例子都基本上是一样的,没有过多的解释,对于一个初学MySQL来说有点难,我把部分转摘过来如下原文:http://www.cnblogs.com/buro79xxd/archive/2012/08/29/2662489.html 要求目标:1.确定需求: 根据部门来分组,显示各员工在部门里按薪水排名名次. 创建表格:2.来创建实例数据: drop table if exists heyf_t10; create table heyf_t10 (empid int ,deptid i

sql server 中判断分组排序的使用示例

现在需要查询一组数据,是对一列字段(column01)的数据分范围查询后分组排序: select (case when [column01] >0 AND [column01]<= 500 THEN 1 when [column01] >500 AND [column01]<= 1000 THEN 2 when [column01] >1000 AND [column01]<= 5000 THEN 3 when [column01] >5000 AND [colu

对数据库表中的某一字段去重分组排序

1.问题背景某数据库t_tab_ab中有两个字段a和b,如下所示: 查询前: 查询后: a b a b 1 2 1 2 1 3 2 3 1 4 3 4 1 5 2 3 2 4 2

MySql 分组排序取时间最大的一条记录

SELECT A.* FROM digital_asset A, (SELECT name, max(last_updated) max_day FROM digital_asset GROUP BY name) B WHERE A.name = B.name AND A.last_updated = B.max_day SELECT A . * FROM bbs_threads A, ( SELECT digest, max( dateline ) max_dateline FROM bbs_

分组排序取次数

原文:分组排序取次数函数 row_number() row_number() over (partition by patient_id /*需要分组的列*/ order by zyid /*排序的列*/) sqlSELECT ZYID, patient_id ,row_number() over (partition by patient_id order by zyid) visit_id from jk_patient_in_hospital oracle create or repla

【记录】T-SQL 分组排序中取出最新数据

原文:[记录]T-SQL 分组排序中取出最新数据示例 Product 表结构: 示例 Product 表数据: 想要的效果是,以 GroupName 字段分组,取出分组中通过 Sort 降序最新的数据,通过示例数据,可以推算出结果数据的 ID 应该为:7.5.3. 示例 SQL 代码: select * from Product p where ID=(select top 1 ID from Product where p.GroupName=GroupName order by Sort

猜你喜欢

删除ecshop云服务及授权关于官方等信息

一.删除[云服务中心] 删除/admin/cloud.php 删除/admin/templates/menu.htm中以下代码 Ajax.call('cloud.php?is_ajax=1>ac ...

通讯录--(适配iOS7/8/9)

导入库#import <AddressBook/AddressBook.h> #import <AddressBookUI/AddressBookUI.h> #pragma m ...

android-----关于通过AIDL注册监听之后无法解除监听的探索

我们在平常使用AIDL时可能会有这样的场景,客户端并不想一直查看服务端有没有有关我的消息,而是想让服务端在有消息的时候能够通知我,随后客户端再去服务端拿消息,这样相对来说比较节省资源,通常我们可以利用 ...

POJ 3311-Hie with the Pie（最短路+状压DP）

题目链接:点击打开链接题意:大致就是邮递员要从0号送快件,一共有n个地方,要求从0开始走完所有的节点在回到0的最短路径.先用Floyd跑出来最短路,然后就是一个裸TSP问题了 TSP:顾名思义,旅 ...

Polycom VVX话机扩展模板

此文章由北京直真信通科技有限公司扩展模块的使用很简单,只需用线缆通过AUX借口把主机和扩展模块连接,再通过配置线路键和编辑地址簿来配置扩展模块即可.不过在使用过程中需要注意: 1.话机版本问题目前 ...

K-邻近算法(kNN)

k-邻近算法优点: 精度高,对异常值不敏感, 无数据输入假定缺点:计算复杂度高, 空间复杂度高使用范围: 数值型, 标称型序号流程说明 1 收集数据可以使用任何方法 2 准备数据距离 ...

leveldb 源码阅读，细节记录memberTable

leveldb 是看着前辈们的大概分析,然后看着源码,将自己的疑惑和解决记录下来: Leveldb源码分析从memberTable插入一条记录和查找一条记录从上而下分析插入: 插入的函数 void ...

IOS沙盒(SandBox)机制以及沙盒目录路径的获取

IOS中的沙盒机制(SandBox)是一种安全体系,它规定了应用程序只能在为该应用创建的文件夹内读取文件,不可以访问其他地方的内容.所有的非代码文件都保存在这个地方,比如图片.声音.属性列表和文本文件 ...

iOS开发-UIApplication和App启动状态

UIApplication简单从字面上了解就是应用程序,开发的时候有的时候会根据需要调用其中的方法,看起来不起眼,实际在iOS开发UIApplication提供了iOS程序运行期间的控制和协作工作.每 ...

php安全之狗尾续貂

Shaun Clowes的文章Exploiting Common Vulnerabilities in PHP(PHP培训 php教程 ) Applications的确写的很棒, 考虑到了很多方面,我 ...

Numeric Type Attributes

[Numeric Type Attributes] INT(4) specifies an INT with a display width of four digits. This optiona ...

[2016-04-16][URAL][2068][Game of Nuts]

时间:2016-04-16 20:19:26 星期六题目编号:[2016-04-16][URAL][2068][Game of Nuts] 题目大意:给定n堆含有奇数个数的石子,每次把石子分成4份, ...

codeblock快捷键

一款开源的C/C++ IDE(集成开发环境),基于wxWidgets GUI体系,跨平台支持. 从别处粘贴的,方便以后看,啦啦啦…… 编辑器快捷键功能 Ctrl+Z 恢复上一次操作 Ctrl+Sh ...

谭浩强 C程序设计 8.10写一函数，输入一行字符，将此字符串中最长的单词输出。

代码量稍微一大,就会出现bug,浪费很多时间,继续努力. #include <stdio.h> void main(){ void maxLen(char str[50]); char s ...

粟至芳瓜心偻氏鼻显德嚎绽饶斜痘

http://www.ebay.com/cln/lpvffjhtx-prnrhjnhh/2014-11-29/138041789016 http://www.ebay.com/cln/rllhbttl ...

BZOJ 2730 矿场搭建（割点）

题目链接:http://61.187.179.132/JudgeOnline/problem.php?id=2730 题意:煤矿工地可以看成是由隧道连接挖煤点组成的无向图.为安全起见,希望在工地发生 ...

Camtasia Studio 8 v8.6.0官方中文版

Camtasia Studio 8是一款老牌的屏幕动作录制工具,软件集合了影像.音效.鼠标移动轨迹.解说声音等多种功能,并且支持声音和摄头同步录制,录制完成后还可以使用Camtasia Studio进 ...

在自己的网站上实现QQ授权登录

最近在实现QQ授权登录,现将我的实现过程以及我的理解整理如下.以下所述如有不对之处,请指正. 官方提供的SDK有:JS,PHP,Java.我的网站使用Scala+Play搭建的,所以只能用JS SDk ...

Python自动化开发课堂笔记【Day04】 - Python基础（函数补充，模块，包）

表达式形式的yield yield的语句形式: yield 1yield的表达式形式: x=yield 1 x=yield 2 g.send('1111') #先把1111传给yield,由yield ...

[Effective JavaScript 笔记] 第12条：理解变量声明提升

js支持词法作用域,即除了极少的例外,对变量的引用会被绑定到声明变量最近的作用域中. js不支持块级作用域,即变量定义的作用域并不是离其最近的封闭语句或代码块,而是包含它们的函数. 不了解这个会产生一 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.