HBase 查询过程中关于scan.setFilter和scan.addColumn的使用

在对HBase数据库的查询中,用到了SingleColumnValueFilter用于实现对于时间列中某一段时间记录的过滤,并且使用scan.addColumn获取结果中的某一列,

具体使用如下:

Scan scan = new Scan();

List<Filter> filters = new ArrayList<Filter>();

String stime = “2012-12-16 00:00:00”;

String etime= “2012-12-16 00:00:10”;

Filter filter1 = new SingleColumnValueFilter(cfs[0].getNameAsString().getBytes(),
"rTime".getBytes(), CompareOp.GREATER_OR_EQUAL,Bytes.toBytes(stime)); 
filters.add(filter1);

Filter filter2 = new SingleColumnValueFilter(cfs[0].getNameAsString().getBytes(),
"rTime".getBytes(), CompareOp.LESS_OR_EQUAL,Bytes.toBytes(etime));
filters.add(filter2);

scan.setFilter(filterList1);
scan.addColumn(cfs[0].getNameAsString().getBytes(), "CARNO".getBytes());
ResultScanner rs = table.getScanner(scan);

但是在程序运行中发现,SingleColumnValueFilter设置的时间区间不起作用,返回的是全部的CARNO。但是在加入“scan.addColumn(cfs[0].getNameAsString().getBytes(), "rTime".getBytes());”后,查询结果正确。由此可见如果scan.addColumn中的列不包括在SingleColumnValueFilter中设置的列时,SingleColumnValueFilter是不起作用的。但是不明白这是为神马。。。。。

相同问题的博客:hbase scan中匪夷所思的SingleColumnValueFilter和COLUMNS

时间: 2024-08-02 02:47:46

HBase 查询过程中关于scan.setFilter和scan.addColumn的使用的相关文章

三种方法实现从“一个(组)查询过程中返回两个表的查询结果”

还记得開始做机房的时候,遇到了要从一个函数中返回两个表的查询结果.当时的解决方法非常"冲动"也非常"无拘无束",直接在实体类里边加入了其它表的实体,效果是达到了,但总认为不伦不类. 如今介绍三种解决上述问题的方法(代码为VB.net.系统使用三层架构). 题设要求:如果我如今要从卡表和学生表里返回查询信息(卡表的comment,money,status和学生表的所有信息),卡表和学生表例如以下: 图一  学生表 图二    卡表 方法一:视图. 比較简单,相信这样的

HBase - 安装过程中的问题

问题1:启动时start-hbase.sh 报 权限不够 原因:在移动文件时,使用root用户在/usr/local下创建的hbase,所以hbase文件夹的使用者为root,其他人没权限 解决方案: 修改权限 查看权限 :  ll /usr/local  - 找hbase, 修改:sudo chown -R userName(要使用的用户名) hbase(文件名) 问题2:启动时只有HMaster,没有HRegionServer,HQuorumPeer 原因:不详,应该是配置文件有问题 解决方

sql查询过程中 update,insert,delete可视化收影响行数

insert into test_tb output inserted.id,inserted.data values('c'),('d') delete from test_tb output deleted.id where data='c' update test_tb set data='abc' output inserted.id as ID ,deleted.data as old_data ,inserted.data as new_data where data='c' wit

CDN高级技术专家周哲: 深度剖析短视频分发过程中的用户体验优化技术点

2018深圳云栖大会已经圆满落幕,在飞天技术汇-弹性计算.网络和CDN专场中,阿里云CDN高级技术专家周哲为我们带来了<海量短视频极速分发>的主题分享,带领我们从视频内容采集.上传.存储和分发的角度介绍整体方案,并且重点讲解短视频加速的注意事项和用户体验优化要点. 讲解从三个部分展开:短视频应用场景,阿里云短视频解决方案,阿里云对短视频用户体验优化的相关优化. 短视频应用场景 短视频比图片和文字包含更多的信息,在移动互联网普及的今天,短视频应用场景非常广泛. 一. 社群分享场景用户可以录制视频

CDN高级技术专家周哲:深度剖析短视频分发过程中的用户体验优化技术点

深圳云栖大会已经圆满落幕,在3月29日飞天技术汇-弹性计算.网络和CDN专场中,阿里云CDN高级技术专家周哲为我们带来了<海量短视频极速分发>的主题分享,带领我们从视频内容采集.上传.存储和分发的角度介绍整体方案,并且重点讲解短视频加速的注意事项和用户体验优化要点. 讲解从三个部分展开:短视频应用场景.阿里云短视频解决方案.阿里云对短视频用户体验的相关优化. 短视频应用场景 短视频比图片和文字包含更多的信息,在移动互联网普及的今天,短视频应用场景非常广泛. 一. 社群分享场景 用户可以录制视频

hbase查询,scan详解

一.shell 查询 hbase 查询相当简单,提供了get和scan两种方式,也不存在多表联合查询的问题.复杂查询需通过hive创建相应外部表,用sql语句自动生成mapreduce进行.但是这种简单,有时为了达到目的,也不是那么顺手.至少和sql查询方式相差较大. hbase 提供了很多过滤器,可对行键,列,值进行过滤.过滤方式可以是子串,二进制,前缀,正则比较等.条件可以是AND,OR等 组合.所以通过过滤,还是能满足需求,找到正确的结果的. 1.1 过滤器类型 HBase 最新官方文档中

Hbase合并Region的过程中出现永久RIT的解决

在合并Region的过程中出现永久RIT怎么办?笔者在生产环境中就遇到过这种情况,在批量合并Region的过程中,出现了永久MERGING_NEW的情况,虽然这种情况不会影响现有集群的正常的服务能力,但是如果集群有某个节点发生重启,那么可能此时该RegionServer上的Region是没法均衡的.因为在RIT状态时,HBase是不会执行Region负载均衡的,即使手动执行balancer命令也是无效的. 如果不解决这种RIT情况,那么后续有HBase节点相继重启,这样会导致整个集群的Regio

HBase集群安装过程中的问题集锦

1.HRegionServer启动不正常 在namenode上执行jps,则可看到hbase启动是否正常,进程如下: [[email protected] bin]# jps26341 HMaster26642 Jps7840 ResourceManager7524 NameNode7699 SecondaryNameNode 由上可见,hadoop启动正常.HBase少了一个进程,猜测应该是有个节点regionserver没有启动成功. 进入节点slave1 ,执行jps查看启动进程: [[e

Hive通过查询语句向表中插入数据过程中发现的坑

前言 最近在学习使用Hive(版本0.13.1)的过程中,发现了一些坑,它们或许是Hive提倡的比关系数据库更加自由的体现(同时引来一些问题),或许是一些bug.总而言之,这些都需要使用Hive的开发人员额外注意.本文旨在列举我发现的2个通过查询语句向表中插入数据过程中的问题,希望大家注意. 数据准备 为了验证接下来出现的问题,需要先准备两张表employees和staged_employees,并准备好测试数据.首先使用以下语句创建表employees: create table employ