创建IndexWriter实例时，通过IndexWriterConfig来设置其相关配置

创建IndexWriter实例时，通过IndexWriterConfig来设置其相关配置：
1.Analyzer：分析器

2.matchVersion：所用Lucene的版本

3.ramBufferSizeMB：随机内存默认为16M.用于控制buffer索引文档的内存上限，如果buffer的索引文档个数到达该上限就写入硬盘。当然，一般来说越大索引速度越快

4.maxBufferedDocs：最大缓存文档数，该参数决定写入内存索引文档个数，到达该数目后就把该内存索引写入硬盘，生成一个新的索引segment文件。所以该参数也就是一个内存buffer，一般来说越大索引速度越快，默认不启用.

5.maxBufferedDeleteTerms：最大缓存删除词条数，当数量达到时会刷新现有的索引段。默认不启用.

6.readerTermsIndexDivisor：索引分词抽样因子，如果值设为N，那么在读取索引的时候每N*termIndexInterval个分词中抽取一个作为样本到RAM中，N值越大所占用的内存越小。

7.mergedSegmentWarmer：默认值为NULL

8.termIndexInterval：索引分词间隔，值越大IndexReader耗费的内存越小。这个参数决定着查询每个分词时所耗费的计算量。通常情况下它代表着在一个分词被定位到时，需要扫描的其他分词的最大值。默认值为32

9.delPolicy：索引删除策略，默认为KeepOnlyLastCommitDeletionPolicy，只保持最近一次的提交信息。

10.Commit：IndexCommit索引的变更如果要可见（如IndexDeletionPolicy,IndexReader中），必须提交COMMIT。每次提交都有一个唯一的segments_N文件与之关联。默认NULL

11.openMode:IndexWriter的打开模式，默认为CREATE_OR_APPEND，如果索引存在则打开进行扩充，否则新建。

12.Similarity：定义索引中分词的权重及打分情况。默认值为IndexSearcher.getDefaultSimilarity()

13.mergeScheduler：合并定时器，每个线程执行一个merge操作，默认为ConcurrentMergeScheduler

14.writeLockTimeout：写锁超时时间默认为1000毫秒

15.indexingChain：索引链，定义文档是如何被索引的，默认采DocumentsWriterPerThread.defaultIndexingChain。有关索引链后面会详细介绍。

16.Codec：编码或解码一个倒排索引段，用于生成一个新的段。

17.infoStream：用于调试信息的管理，默认为InfoStream.getDefault()不记录任何调试信息。

18.mergePolicy：索引段的合并策略。默认为TieredMergePolicy根据每一层允许的段数合并大小相似的段。

19.flushPolicy：索引段数据刷新策略。即RAM内存中的数据何时刷新到物理结构中。默认为FlushByRamOrCountsPolicy，即根据RAM的使用情况，maxBufferedDocs和maxBufferedDeleteTerms的值来制定刷新策略。

20.readerPooling：实例化IndexReader是非常昂贵的操作，且它是一个线程安全的，跟索引目录是一一对应的，最好的方式就是用一个Pool去维护这些IndexReader：保证一个文件目录只有一个实例，且不同的IndexReader可以动态的组合。默认为false 不使用Pool.

21.indexerThreadPool:对documents建立索引的线程池，默认线程池中保持8个线程。

22.perThreadHardLimitMB：设置每个段内存使用的上限，如果达到该上限就会对段进行强制刷新。默认值为1945M。

时间： 2024-11-05 22:48:51

创建IndexWriter实例时，通过IndexWriterConfig来设置其相关配置

创建IndexWriter实例时，通过IndexWriterConfig来设置其相关配置的相关文章

域初始化、静态块及构造方法等在创建类实例时的执行顺序（转载）

(转)创建DB2实例时出错，请大家帮忙解决

UI第九讲.UITableView表视图创建,表视图的重用机制,表视图的相关配置方法

工作中linux定时任务的设置及相关配置

关于在openstack中创建实例时任务一直卡在Building的现象描述

linux下数据库实例监听开机自启动设置

DBCA静默方式创建数据库实例

CentOS7_86_64创建Oracle实例且设置开机自启以及允许远程连接

Spark2.2+ES6.4.2（三十二）：ES API之ndex的create（创建index时设置setting，并创建index后根据avro模板动态设置index的mapping）/update/delete/open/close