Hadoop技巧(04):简易处理solr date 时区问题

阅读目录

  • 创建collection
  • 模拟程序
  • 示例下载
  • 系列索引

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

文章是哥(mephisto)写的,SourceLink

在cdh集成的solr cloud中,我们可以通过solr管理界面进行查询,也可以通过java的api进行查询,但查询过程中,如果是时间类型的,可能会存在两者在界面上看上去不一致的问题,两者时间刚好相差本地的时区。

创建collection

一:上传配置文件

  为了模拟现象,我们设置如下solr文档结构

solrctl instancedir --create date_demo /data/solr_s

二:创建collection

solrctl collection --create date_demo -s 2 -m 2 -r 2

创建完后solr的collection如下

模拟程序

一:编写程序

  编写模拟插入程序。为了容易查看,只插入2条数据。

  这里我们使用的solr版本为4.10.3。

    private void insert() throws SolrServerException, IOException,
            ParseException {
        String zhHost = "master1/solr";

        CloudSolrServer cloudSolrServer = new CloudSolrServer(zhHost);

        cloudSolrServer.setDefaultCollection("date_demo");

        String id_1 = UUID.randomUUID().toString().replaceAll("-", "")
                .toUpperCase();
        String name_1 = "1点前+8";
        Date createDate_1 = sdfDate.parse("2016-12-30 00:11:12");
        String day_1 = sdfDay.format(createDate_1);

        String id_2 = UUID.randomUUID().toString().replaceAll("-", "")
                .toUpperCase();
        String name_2 = "1点后+8";
        Date createDate_2 = sdfDate.parse("2016-12-30 10:13:14");
        String day_2 = sdfDay.format(createDate_2);

        SolrInputDocument solrInputDocument1 = create(id_1, name_1, day_1,
                createDate_1);
        SolrInputDocument solrInputDocument2 = create(id_2, name_2, day_2,
                createDate_2);

        cloudSolrServer.add(solrInputDocument1);
        cloudSolrServer.add(solrInputDocument2);
        cloudSolrServer.commit();

        System.out.println("success");
    }

二:运行程序

  可以看到我们已经插入2条数据。

三:程序查询

  在程序查询的结果如下。

  可以看到solr自己的查询界面使用的时间格式是UTC的,会有时差,我们这里是8小时。
CREATEDAY和CREATEDATE有时候不一致。

四:处理

  所以为了3方的统一,要么自己改solr界面查询的。要么自己改下时差,使得3方结果一致,方便使用。

  这里我们采用自己修改时差来同步。

  但工具量挺大,得在solr插入的时候转换下时间格式程utc。还的在每次查询的时候转换回来。
所以这里就自己恶心下自己,改下solr源码,在源码中找到对应的位置,固定的修改成自己这里的时差。
这样就间接的使3方同步了。

  找到solr相关的处理代码类

org.apache.solr.common.util.JavaBinCodec.java

  在readVal下

return new Date(dis.readLong()-28800000l);//因为存储的时候solr的时间格式是utc的,所以这里减掉当前时区的值

  在writePrimitive下

daos.writeLong(((Date) val).getTime()+28800000l);//存入的时候为了同day string同步 加8小时

  这样就可以了。

  我们查看效果。
  为了对比 将数据的名称加备注+8

  solr查询页面

--------------------------------------------------------------------

  到此,本章节的内容讲述完毕。

示例下载

Github:https://github.com/sinodzh/HadoopExample/tree/master/2017/solr.demo/

系列索引

  Hadoop技巧系列索引

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

文章是哥(mephisto)写的,SourceLink

时间: 2024-12-10 09:05:09

Hadoop技巧(04):简易处理solr date 时区问题的相关文章

solr date 时区 8小时时差问题

初学solr在schema 里面配置并使用sorl的date或者tdate类型,具体类型与使用如下: <field name="tdate_field"type="tdate"indexed="true"stored="true"/> <field name="date_field"type="date"indexed="true"stored=&q

Hadoop技巧(02):时间同步

阅读目录 序 时间同步 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 在实际部署过程中,Hadoop中服务器节点之间需要时间同步,但Hadoop集群可能需要和其他业务系统的时间进行同步,那么就会存在其他偶尔发生的问题. 下面就这种场景进行描述. 时间同步 一:说明 在实际部署过程中,Hadoop集群需要跟业务系统的服务器集群需要时间同步,如果时间跳动较小,娜ntp会自己纠正过来

Hadoop技巧(01):插件,终端权限

阅读目录 序 HDFS权限 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 在hadoop开发或者使用中,可能会使用到一些插件或3方软件,比如:Eclipse的Hadoop插件,ETL的Kettle.那么就存在一个hdfs目录权限的问题. 下面就这个权限问题进行阐述. HDFS权限 一:目录结构 Hadoop文件系统HDFS的用户为hdfs,默认密码为空.HDFS根目录下还有一个

Flex Date 时区转换

项目放到国外服务上时,由于有时区差异,要获得服务器时间就得进行时区转换 private function getTimeZoneFix(fixDate:Date, GMTHour:NUmber = 8):Date { var gmtDate:Date = new Date(fixDate); var hourOffset:Number = gmtDate.getTimezoneOffset() / 60 - GMTHour; gmtDate.setHours(gmtDate.getHours()

点滴记录——Ubuntu 14.04中Solr与Tomcat整合安装

转载请说明出处:http://blog.csdn.net/cywosp/article/details/38965981 1. 安装jdk,tomcat sudo apt-get install tomcat7 openjdk-7-jdk openjdk-7-jre 2. 到http://lucene.apache.org/solr/下载最新的solr,注意别下到源码包 solr-4.9.0.tgz sudo mv solr-4.9.0.tgz /mnt cd /mnt && sudo t

solr中时区处理

solr.in.sh中的最后 # By default the start script uses UTC; override the timezone if needed SOLR_TIMEZONE="Asia/Shanghai" 也会变成如下方式,可以ps -ef|grep solr查看 -Duser.timezone=Asia/Shanghai ,所以你在tomcat/bin/setenv.sh中增加这个参数即可. TOMCAT_TIMEZONE="-Duser.tim

Date, TimeZone, MongoDB, java中date的时区问题

打印new Date(),Fri Aug 12 13:37:51 CST 2016. 显示Asia/Shanghai的时区,但是date toString 的时区简写却是CST.更坑爹的是,Google CST结果出来是Central Standard Time. 表示North American Central Standard Time. 还以为jdk的date类有问题,debug date toString发现确实是将Asia/Shanghai的name 简写成CST. 接着google,

Solr使用入门指南

本文转自http://chuanliang2007.spaces.live.com/blog/cns!E5B7AB2851A4C9D2!499.entry?wa=wsignin1.0 由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索.工作量及扩展性都较大,不采用. 2. 调用Google.Baidu的API实现站内搜索.同第三方搜索引擎绑定太死,无法满足后期业

JS基础--Date

一.Date类型 Date类型使用自UTC(Coordinated Universal Time,国际协调时间)1970年1月1日午夜起至改日期止经过的毫秒数. 二.创建日期对象 var date=new Date()——创建一个表示当地时区的当前时间的Date对象. var date=new Date("May 25,2004")——返回时间毫秒数,如果参数为数字,则返回当前数字表示毫秒数的时间. ECMAScript提供的两个方法:(都是基于本地时区而非GTM). Date.par