Hive 对列通配查询

本文记录hive列通配查询相关使用,通常写hql的时候大家经常在where过滤条件中使用通配,其实在hive中select的时候对列同样可以使用正则通配。

使用场景:表中列比较多,且有规律的名字(col1_a,col1_b,col2_z,col2_d,col10_w ……),查数据是列出所有列比较麻烦(懒人模式)。

select `col\d+` from table
-- 查出所有"col"+数字的列,如: col1,col23,col100
时间: 2024-10-05 04:37:43

Hive 对列通配查询的相关文章

Hadoop进阶之输入路径如何正则通配?

在hadoop的编程中,如果你是手写MapReduce来处理一些数据,那么就避免不了输入输出参数路径的设定,hadoop里文件基类FileInputFormat提供了如下几种api来制定: 如上图,里面有 (1)addInputPath(),每次添加一个输入路径Path (2)addInputPaths, 将多个路径以逗号分割的字符串,作为入参,支持多个路径 (3)setInputPath ,设置一个输入路径Path,会覆盖原来的路径 (4)setInputPath , 设置多个路径,支持Had

使用正则表达式实现像SQL中LIKE语句中的%和_通配

在项目中我们经常遇到将数据库的数据取到后再次进行筛选过滤的情况.LINQ to Entity提供了统一的查询接口并且可以高效的完成工作,但是对于我们常在SQL中使用的%和_这样的通配符并没有支持.我们只能通过String.Contains方法来实现简单的通配.使用String.Contains方法是无法达到在查询串中使用通配符的目的的.正则表达式虽然晦涩难懂,但功能十分强大,解决个统配符绰绰有余. 代码如下:     public static class LINQHelper     {   

linux文件管理类命令,类型,用户的权限管理及bash shell的特性:命令别名,文件名通配

文件管理类命令 ls 查看 :cat tac more less head tail 复制:cp -r:递归 -i:提示,交互 -f:强制覆盖 -a :保留所有文件信息 -d:当源为链接文件时,复制链接本身,而非源文件 -p:保持原有属性 删除 : rm 删除非空目录 rm -rf 移动 : mv 创建 : touch 用来修改时间戳,创建空文件 -c:不创建新文件,只修改时间戳 -a:仅修改访问时间 -m:修改修改时间 -t:指定时间戳 先加-m再加-t后跟时间 元数据属性:stat 显示文件

正则表达式,文件名通配,扩展正则之间的一些异同

正则表达式是一个神器,但初学linux时候还有文件名通配这样的东东.今天就总结一下文件名通配,正则表达式,扩展正则表达式之间有什么异同.可能写的不全,求指教. 使用方面: 正则多用来匹配过滤文本内容. 文件名通配符则用来匹配文件名较多. 支持命令: 文件处理,查看cp find ls rm mv touch 等一系列的文件匹配查找命令.(和上面说的是一个意思) 正则表达式则用在文本内容处理的各种工具grep,awk,sed,vim末行模式等. 匹配功能上正则规矩多,自然能力更强大,所以就这的区别

[case分享]Exchange 2013通配证书无法分配POP和IMAP服务

环境: AD+Exchange 2013 问题: Exchange服务器使用通配证书,在证书分配服务却提示无法分配POP和IMAP服务? 解决方法: 在EMS输入 Set-ImapSettings -X509CertificateName mail.contoso.com Set-PopSettings -X509CertificateName mail.contoso.com 然后重启IMAP和POP3服务即可

bash的基本特性之文件名通配 及IO重定向,管道详解

本篇博文依然涉及到bash的基本特性 文件名通配,并讲解IO重定向以及管道的使用 管道配合tr命令的应用 bash的基础特性之一:文件名通配 globbing:文件名通配(整体文件名匹配,而非部分) 匹配模式:元字符 *:匹配任意长度的任意字符 pa*,*pa*,*pa,*p*a* ?:匹配任意单个字符 pa?,??pa,p?a,p?a? []:匹配指定范围内的任意单个字符 有几种特殊字符: [a-z],[A-Z],[0-9],[a-z0-9] [[:upper:]]:所有大写字母 [[:low

赛门铁克通配符SSL证书,一张通配型证书实现全站加密

  赛门铁克通配型SSL证书,验证域名所有权和企业信息,属于企业验证(OV) 级SSL证书,最高支持256位加密.申请通配符SSL证书可以保护相同主域名下无限数量的多个子域名(主机).例如,一个通配符SSL证书通用名(Common Name)为:*. domain.com ,则该证书可用于www.domain.com , mail.domain.com ,buy.domain.com -等任何在 domain.com 域下的其他二级子域名.当客户端在访问配置了这种类型的SSL证书的站点时,浏览器

python 目录遍历、通配查找、文件属性

# -*- coding:utf-8 -*- __author__ = 'magicpwn' import os import time import os.path import pprint import glob pa = 'C:/XML/Result/result.xls' print os.path.dirname(pa) print 'Access time访问时间:', time.ctime(os.path.getatime(pa)) print 'modified time修改时

文件名通配

命令别名 alias cls='clear' 在shell中定义的别名仅在当前shell生命周期中有效: 别名的有效范围:当前shell进程 unalias cls \CMD 使用命令本身 命令替换 $(pwd) , 反引号:`pwd` 把命令中某个子命令替换为其执行结果的过程 echo "The current directory is $(pwd)." touch ./file-$(date +%F-%H-%M-%S).txt bash支持的引号: ``:命令替换 "&q