Solr Update备注

参考资料:

http://wiki.apache.org/solr/ExtractingRequestHandler#Sending_documents_to_Solr

/update

标准的update request handler,适用于XML,JSON,CSV或者JAVABIN文件类型

<requestHandler name="/update" class="solr.UpdateRequestHandler">
     <lst name="defaults">
        <str name="update.chain">uuid</str>
     </lst>
</requestHandler>

/update/extract

除了以上标准文件之外的文件,可通过此配置来为文件建索引

依赖包

  <lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
  <lib dir="../../contrib/extraction/lib" regex=".*\.jar" />

常规配置

  <requestHandler name="/update/extract"
                  startup="lazy"
                  class="solr.extraction.ExtractingRequestHandler" >
      <lst name="defaults">
      <str name="xpath">/xhtml:html/xhtml:body/descendant:node()</str>
      <str name="capture">content</str>
      <str name="fmap.meta">attr_meta_</str>
      <str name="uprefix">attr_</str>
      <str name="lowernames">true</str>
      <str name="update.chain">uuid</str>
    </lst>
</requestHandler>
时间: 2024-10-29 19:11:19

Solr Update备注的相关文章

Solr Update插件自定义Update Chain按条件更新索引

背景:基于call客,来电和跟进记录等多个数据来源的用户文档,需要在更新是判断首来源的时间. 如对电话号码11xxxx来说,来电时间是今天,call客时间是昨天,而call客数据又可能因为网络原因晚上传上来,这样一来11xxxx这个用户document的来源时间需要更新成昨天. 分析:solr的默认update没有办法匹配业务的灵活的更新逻辑.更新逻辑如下,当更新来源时间的时候,如果新的来源时间比之前的来源时间晚,则保持之前的来源时间. 代码实现: package custom.solr; im

Solr使用入门指南

本文转自http://chuanliang2007.spaces.live.com/blog/cns!E5B7AB2851A4C9D2!499.entry?wa=wsignin1.0 由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索.工作量及扩展性都较大,不采用. 2. 调用Google.Baidu的API实现站内搜索.同第三方搜索引擎绑定太死,无法满足后期业

基于Solr的HBase多条件查询测试

转自:http://www.cnblogs.com/chenz/articles/3229997.html 背景: 某电信项目中采用HBase来存储用户终端明细数据,供前台页面即时查询.HBase无可置疑拥有其优势,但其本身只对rowkey支持毫秒级的快速检索,对于多字段的组合查询却无能为力.针对HBase的多条件查询也有多种方案,但是这些方案要么太复杂,要么效率太低,本文只对基于Solr的HBase多条件查询方案进行测试和验证. 原理: 基于Solr的HBase多条件查询原理很简单,将HBas

[转载] Solr使用入门指南

转载自http://blog.csdn.net/liuzhenwen/article/details/4060922 由于搜索引擎功能在门户社区中对提高用户体验有着重要的作用,在门户社区中涉及大量需要搜索引擎的功能需求,目前在实现搜索引擎的方案上有几种方案可供选择: 1. 基于Lucene自己进行封装实现站内搜索.工作量及扩展性都较大,不采用. 2. 调用Google.Baidu的API实现站内搜索.同第三方搜索引擎绑定太死,无法满足后期业务扩展需要,暂时不采用. 3. 基于Compass+Lu

Solr4.8.0源码分析(4)之Eclipse Solr调试环境搭建

Solr4.8.0源码分析(4)之Eclipse Solr调试环境搭建 由于公司里的Solr调试都是用远程jpda进行的,但是家里只有一台电脑所以不能jpda进行调试,这是因为jpda的端口冲突.所以只能在Eclipse 搭建Solr的环境,折腾了一小时终于完成了. 1. JDPA远程调试 搭建换完成Solr环境后,对${TOMCAT_HOME}/bin/startup.sh 最后一行进行修改,如下所示: 1 set JPDA_ADDRESS=7070 2 exec "$PRGDIR"

solr环境搭建及java小demo

一配置solr环境 1.下载solr 2.配置solr(最好单独分离出一个tomcat,一台机器启动多个tomcat参见:http://www.cnblogs.com/lxlwellaccessful/p/6746341.html) a.在下载的solr文件夹下的\example\solr\下将文件全部考到一个文件夹中(本人是放在E:\MySoft\solr\home中的) b.初始化solr实例 在solr解压路径的\example\webapps\路径下有一个solr.war,将其复制到to

Solr 4.5环境搭建初探

solr4.5配置tomcat7 http://blog.csdn.net/chengzhengliang/article/details/14123889 Solr使用入门指南 http://blog.csdn.net/liuzhenwen/article/details/4060922 使用Apache Solr对数据库建立索引(包括处理CLOB.CLOB) http://www.blogjava.net/conans/articles/379546.html 1.安装好tomcat,本文安

solr连接数据库配置

一般要搜索的信息都是被存储在数据库里面的,但是我们不能直接搜数据库,所以只有借助Solr将要搜索的信息在搜索服务器上进行索引,然后在客户端供客户使用. 一.链接数据库 1. SQL配置 拿SQL Server 为例,需要先下载Sql Server的jar包,下载地址: http://msdn.microsoft.com/en-us/data/aa937724.aspx 解压缩之后将sqljdbc4.jar复制到webapps\solr\WEB-INF\lib下,也就是本例的: D:\apache

集成PHP应用和SOLR

集成 PHP 应用和 Solr 搜索引擎 您的评价:          收藏该经验     你为什么需要搜索引擎?单纯数据库不够用?如果你只是创建小网站,数据库就够了.但当你创建中性或大型应用的时候,搜索引擎是更明智的选择.当然如是一说,小网站也可以利用Solr,获得高相关性的搜索结果. 想象一下你在写一个电子商务网站的搜索查询程序.最直接的想法就是如下的数据库查询语句: ? 1 2 3 SELECT * FROM PRODUCTS WHERE LOWER(title) like LOWER('