solr配置-Schema.xml

可参考配置:http://wiki.apache.org/solr/SchemaXml(基本上文档上面讲的已经很详细了)

先来看一下Schema.xml都有什么配置

1,uniqueKey

2,n多name不一样的fieldType

3,各种field :field,dynamicField,copyField

4,默认被注释掉的defaultSearchField,solrQueryParser,Similarity

下面来看一下具体都什么意思:

1,uniqueKey:文档的唯一标识、唯一键,这里配置的是下面出现的field 一般都叫id,在更新、删除的时都会用到

<uniqueKey>id</uniqueKey>

2,fieldType:是一些常见的可重用定义,定义了 Solr如何处理 Field。也就是添加到索引中的xml文件属性中的类型,如int、text、date等.

属性说明:

name   # 标识,与Field type对应
class    #对应solr已定义的type Class
sortMissingLast    #设置成true没有该field的数据排在有该field的数据之后,而不管请求时的排序规则, 默认是false。
sortMissingFirst    #反之,默认是false
analyzer    #字段类型指定的分词器tokenizer  #分词器类type    #当前分词用用于的操作.index代表生成索引时使用的分词器query代码在查询时使用的分词器
filter    #分词后使用的过滤器,调用顺序和配置相同

3,Fields 就是定义那些你要在搜索结果中展示的字段,即在doucument中使用,用于搜索或者只是展示

field:     普通的字段设置

 <field name="sn"        type="string" indexed="true" stored="true" />  

dynamicField: 动态的字段设置,用于后期自定义字段,*号通配符.例如: test_i就是int类型的动态字段.

 <dynamicField name="*_i"  type="integer"  indexed="true"  stored="true"/>

copyField:  一般用于检索时用的字段,这样就只对这一个字段进行索引分词,copyField的dest字段如果有多个source一定要设置multiValued=true,否则会报错的

 <copyField source="body" dest="teaser" maxChars="300"/>

fields属性说明:

name    #字段类型名
class    #java类名
indexed    #默认true。 是否被索引,说明这个数据应被搜索和排序,一般与stored反之。
stored    #默认true。是否被存储,说明这个字段被包含在搜索结果中,一般与indexed反之。
omitNorms    #字段的长度不影响得分和在索引时不做boost时,设置它为true。一般文本字段不设置为true。
termVectors    #如果字段被用来做more like this 和highlight的特性时应设置为true。
compressed    #字段是压缩的。这可能导致索引和搜索变慢,但会减少存储空间,只有StrField和TextField是可以压缩,这通常适合字段的长度超过200个字符。
multiValued    #是否有多个值。
positionIncrementGap    #和multiValued一起使用,设置多个值之间空白的数量

4,  defaultSearchField:默认搜索属性,如q=text就是默认的搜索text字段

<defaultSearchField>text</defaultSearchField>

     solrQueryParser:查询转换模式,是并且还是或者(AND/OR必须大写)

<solrQueryParser defaultOperator="OR"/>

    Similarity:自定义评分器,class是继承 DefaultSimilarity的子类,或者实现评分器接口的类,

                下面的参数str 应该是可配置名称为paramkey,值为param value的参数吧

<similarity class="com.example.solr.CustomSimilarityFactory">
       <str name="paramkey">param value</str>
</similarity>
时间: 2024-10-13 22:11:06

solr配置-Schema.xml的相关文章

solr配置schema.xml学习

solr创建索引.添加数据的关键是配置schema.xml文件,该文件中主要是完成配置数据源.索引字段.数据类型等定义.同时,该文件的配置直接影响到solr搜索的效率和准确性. 一.搜索类型FileType name:指的是FileType的名字 class:指向org.apache.solr.analysis包里面对应的class名称,用来定义这个类型的行为 <types> <fieldType name="string" class="solr.StrF

solr的schema.xml配置属性解释

schema.xml做什么? SOLR加载数据,创建索引和数据时,核心数据结构的配置文件是schema.xml,该配置文件主要用于配置数据源,字段类型定义,搜索类型定义等.schema.xml的配置直接影响搜索结果的准确性与效率. <types></types>节点 types节点主要用于搜索类型的定义,这里给出常用类型的定义. 1 <fieldType name="string" class="solr.StrField" sortM

数据库中间件DBLE学习(二) 学习配置schema.xml

前言 一边有一个经常引诱我让我"娱乐至死"的视频,还有一个不停"鞭策"我让我快点学习的大BOSS.正是有这两种极端的爱才让我常常在自信中明白自己努力的方向.嗯,"人间不值得"! SCHEMA.XML介绍 上一篇写了:数据库中间件DBLE学习(一) 基本介绍和快速搭建,主要介绍快速安装.在安装的过程中,我们配置了schema.xml文件.schema.xml是一个比较重要的文件.该文件提供了逻辑库,逻辑表,分片规则,数据分片,物理数据库等配置.它主

利用SOLR搭建企业搜索平台 之——模式配置Schema.xml

来源:http://blog.csdn.net/awj3584/article/details/16963525 schema.xml这个配置文件可以在你下载solr包的安装解压目录的\solr\example\solr\collection1\conf中找到,它就是solr模式关联的文件.打开这个配置文件,你会发现有详细的注释.模式组织主要分为三个重要配置 1. types 部分 是一些常见的可重用定义,定义了 Solr(和 Lucene)如何处理 Field.也就是添加到索引中的xml文件属

solr的schema.xml配置介绍

schema.xml配置介绍如下: 常见的元素有以下几种: <field name="weight" type="float" indexed="true" stored="true"/> <dynamicField name="*_i"  type="int"    indexed="true"  stored="true"/&

Solr中schema.xml的解释

接Solr-4.10.2与Tomcat整合.schema.xml位于D:\solr\data\solr\collection1\conf\中.1.fieldType节点    name: FieldType的名称    class: 指向org.apache.solr.analysis包里面对应的class名称,用来定义这个类型的行为    omitNorms: 字段检索时被省略相关的规范    positionIncrementGap:定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误 

3 Solr配置文件 schema.xml

1 添加自己的分词器(mmseg4j) 意思是textCommplex 这个类型,用的是 com.chenlb.mmseg4j.solr.MMSegTokenizerFactory 这个分词器,词库是用到的solr.home目录下面的dic目录, 但是mmseg4j.jar 1.9 把词库包进去了,想要用外面的,需要把里面的删除掉, <filter class="solr.LowerCaseFilterFactory"/>  下面可选择性的添加一些自己的过滤器 <fi

利用SOLR搭建企业搜索平台 之——solr配置solrconfig.xml

solrconfig.xml这个配置文件可以在你下载solr包的安装解压目录的E:\Work\solr-4.2.0-src-idea\solr\example\solr\collection1\conf中找到,这个配置文件内容有点多,主要内容有:使用的lib配置,包含依赖的jar和Solr的一些插件;组件信息配置;索引配置和查询配置,下面详细说一下索引配置和查询配置. 1索引indexConfig Solr 性能因素,来了解与各种更改相关的性能权衡. 下表概括了可控制 Solr 索引处理的各种因

solr配置-Solrconfig.xml

可参考配置:http://wiki.apache.org/solr/SolrConfigXml lib <lib> 标签用于引入solr引用SolrPlugins的jar包,当dir对应的目录不存在时,solr会忽略此, <lib dir="../../../contrib/extraction/lib" regex=".*\.jar" /> dataDir parameter 配置data目录的存放位置,data目录中存放了index和lo