lucene写索引出现锁文件的原因之一

lucene正常情况目录下的文件有三个文件.

　　segments.gen segments_a08, 还有一个类似 _uw.cfs名字的东西. 当然,不一定都一样, 但肯定是这三个. 如果出现了很多文件.不要着急, 看下面的 .

　　如果lucene的索引目录下出现了很多文件, 肯定是有问题的. 几个方面.首先lucene在执行写操作时, 会先在目录下写如一个write.lock的文件锁定这个目录,以避免别的索引再操作这个路径. 否则那样肯定会乱. 锁定之后, 开始写索引, 写索引时lucene建了几个或者几十个临时片段文件, 都似乎又短又乱的字符.cfs的文件. 当索引建立完毕后,没有执行 indexWriter.optimize();方法, 他就不会合并那些乱七八糟的文件. 所以,索引建完后, 一定要执行上面的优化方法, 保持目录下保留3个文件即可. 也就是很多临时文件会合并到一个文件中去. 切不可大意删除. 但当数据很多时, 另行考虑策略.

　　 lucene在写入索引时, 用在索引目录下建write.lock文件来标识锁定. 而只有在执行close()方法后, 才会删除这个锁文件. 只要这个文件存在, 其他的写索引的程序都会报错:

caught a class org.apache.lucene.store.LockObtainFailedException
with message: Lock obtain timed out: [email protected]:javasourceLuceneTestindexwrite.lock

　　所以,需要注意, 一定要注意关闭indexWrite. 包括异常下,用finally关闭.否则会导致下一次写索引失败.，修改程序后，直接删除write.lock文件后就可以了。

转载注明本文地址：http://www.ablanxue.com/shtml/201411/25889_1.shtml

时间： 2024-10-22 18:34:56

lucene写索引出现锁文件的原因之一的相关文章

Lucene.net之解决锁的问题

1 public sealed class SearchIndexManager 2 { 3 private static readonly SearchIndexManager searchManager=new SearchIndexManager(); 4 private SearchIndexManager() 5 { 6 7 } 8 public static SearchIndexManager GetSingleSearchManager() 9 { 10 return searc

Solr4.8.0源码分析(10)之Lucene的索引文件(3)

Solr4.8.0源码分析(10)之Lucene的索引文件(3) 1. .si文件 .si文件存储了段的元数据,主要涉及SegmentInfoFormat.java和Segmentinfo.java这两个文件.由于本文介绍的Solr4.8.0,所以对应的是SegmentInfoFormat的子类Lucene46SegmentInfoFormat. 首先来看下.si文件的格式头部(header) 版本(SegVersion) doc个数(SegSize) 是否符合文档格式(IsCompoundF

Solr4.8.0源码分析(11)之Lucene的索引文件(4)

Solr4.8.0源码分析(11)之Lucene的索引文件(4) 1. .dvd和.dvm文件 .dvm是存放了DocValue域的元数据,比如DocValue偏移量. .dvd则存放了DocValue的数据. 在Solr4.8.0中,dvd以及dvm用到的Lucene编码格式是Lucene45DocValuesFormat.跟之前的文件格式类似,它分别包含Lucene45DocValuesProducer 和Lucene45DocValuesConsumer来实现该文件的读和写. 1 @Ove

Solr4.8.0源码分析(8)之Lucene的索引文件(1)

Solr4.8.0源码分析(8)之Lucene的索引文件(1) 题记:最近有幸看到觉先大神的Lucene的博客,感觉自己之前学习的以及工作的太为肤浅,所以决定先跟随觉先大神的博客学习下Lucene的原理.由于觉先大神主要介绍的是Lucene3.X系的,那我就根据源码以及结合觉先大神的来学习下4.X系的.内容可能会有些变化,且加入下我个人的理解. http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.html 一. 基本类型

Windows、Linux下文件操作(写、删除)错误的产生原因、及解决方法

catalog 0. 引言 1. Linux平台上涉及的File IO操作 2. Windows平台上涉及的File IO操作 0. 引言本文试图讨论在windows.linux操作系统上基于C库进行文件IO操作时,可能遇到的错误,及其解决方法,主机安全攻防产品除了需要将安全攻防上的领域知识固化到程序实现上之外,还极度依赖关联系统本身.编程语言库的特性,原则上,并不是所有的安全需求都能100%地落实到程序设计中,这需要我们对操作系统.编程语言本身具有较深的理解 Relevant Link: h

[转载] 写mmap内存和文件产生几百ms延迟原因

原文: http://weibo.com/p/1001603830912709174661 写mmap内存和文件产生几百ms延迟原因 2015年4月12日 21:10 阅读 4274 最近看到一个bug介绍,作者花了4个月追踪定位,发现jvm统计会造成垃圾回收过程停顿好几百ms.jvm统计信息会写到一片内存区域中,该区域mmap到/tmp下的文件. 这个Bug的详细情况见下面的链接: The Four Month Bug: JVM statistics cause garbage collect

Solr4.8.0源码分析(12)之Lucene的索引文件(5)

Solr4.8.0源码分析(12)之Lucene的索引文件(5) 1. 存储域数据文件(.fdt和.fdx) Solr4.8.0里面使用的fdt和fdx的格式是lucene4.1的.为了提升压缩比,StoredFieldsFormat以16KB为单位对文档进行压缩,使用的压缩算法是LZ4,由于它更着眼于速度而不是压缩比,所以它能快速压缩以及解压. 1.1 存储域数据文件(.fdt) 真正保存存储域(stored field)信息的是fdt文件,该文件存放了压缩后的文档,按16kb或者更大的模块大

Solr4.8.0源码分析(9)之Lucene的索引文件(2)

Solr4.8.0源码分析(9)之Lucene的索引文件(2) 一. Segments_N文件一个索引对应一个目录,索引文件都存放在目录里面.Solr的索引文件存放在Solr/Home下的core/data/index目录中,一个core对应一个索引. Segments_N例举了索引所有有效的segments信息以及删除的具体信息,一个索引可以有多个Segments_N,但是有效的往往总是N最大的那个,为什么会出现多个segments_N,主要是由于暂时无法删除它们或者有indexwriter

利用Lucene测试索引生成的segment.fnm文件所包含的内容（详解）

/* * * 这段代码用来测试文件segment.fnm文件所包含的内容 * .fnm包含了Document中的所有field名称 * */ 生成的索引文件.fnm中所包含了Document的所有Field名称. 如图就是生成索引,打开所显示的文件. package segment; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache

猜你喜欢

git 把本地创建的项目放到github上

很早之前就注册了Github,但对其使用一直懵懵懂懂,很不熟练.直到昨天做完百度前端技术学院的task,想把代码托管到Github上的时候发现自己对于Git的操作是如此之愚钝,所以今天决定把Git好好 ...

零基础的人该怎么学习JAVA

对于JAVA有所兴趣但又是零基础的人,该如何学习JAVA呢?对于想要学习开发技术的学子来说找到一个合适自己的培训机构是非常难的事情,在选择的过程中总是因为这样或那样的问题让你犹豫不决,阻碍你前进的步 ...

bootstrap中的对话框-dialog-2

<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <meta name= ...

作业三: 代码规范、代码复审、PSP

(1) 是否需要有代码规范 1.这些规范都是官僚制度下产生的浪费大家的编程时间.影响人们开发效率, 浪费时间的东西.(反对) 答:首先编码规范包括了编码风格和其它规范一个团队遵守一 ...

字符串：格式化

一.字符串格式化的format方法 format方法接受位置参数和关键字参数 #位置参数 >>> "{0} love {1}".format('I','you') ...

Project Euler 83：Path sum: four ways 路径和：4个方向

Path sum: four ways NOTE: This problem is a significantly more challenging version of Problem 81. In ...

[转]Linux统计代码行数

wc -l *.c *.h 就可以知道当前目录下的所有c 和 h 文件的行数的详细信息.很不错如果要递归,可以配合其他命令一起使用当前目录及子目录: find . -name *.c |xargs ...

实现表格分页

由于工作需要,经常在开发中需要实现表格分页这种特效,目的的为提升用户体验,减少大数据渲染数量. 分页的分两种,一种是要和服务器交互,另一种是一次性拿到所有数据,在本地做分页处理.本次主要谈论第二种. ...

Category的作用 Category:也叫分类,类目.是为没有源代码的类扩充功能扩充的功能会成为原有类的一部分,可以通过原有类或者原有类的对象直接调用,并且可继承. 但是该方式只能扩充方法,不能 ...

//程序员:罗元昊 2017.9.6public class my{ public static void main(String[] args){ int a=35+100*60; //将跑步时间转 ...

2016 - 1- 24 随便写写~~

反正也没什么人看就随便写写吧~ 我是从来没想过我可能会成为一个码农的,虽然我现在很讨厌这个词啊哈哈哈. 说实话,直到今天我都觉得自己大学生活过的好失败,什么都没学到,白白浪费了三年多的光阴.好像从来 ...

自增长的聚集键值不会扩展（scale）

如何选择聚集键值的最佳实践是什么?一个好的聚集键值应该有下列属性: 范围小的(Narrow) 静态的(Static) 自增长的(Ever Increasing) 我们来具体看下所有这3个属性,还有在S ...

嗽萝似诳磐l1s848x2t540a5d3i

http://t.cn/RUV4o3s?lcqfhttp://weibo.com/20151030p/2308373903590140912231?fqqzhttp://sina.lt/dDVbhtt ...

amazon 设计 6 parking lot

public abstract class Vehicle { protected ParkingSpace pSpace; public abstract boolean park(ParkingL ...

Mysql 使用 select into outfile

Mysql支持将查询结果到处默认语法 select .. from table into outfile "filepath\filename.txt"; 如果在执行的过程中遇 ...

Python学习之路15——列表实现栈和队列

栈栈是一种后进先出(LIFO)的数据结构.你可以通过push操作来向栈中添加一个对象,也可以通过pop操作来返回并删除栈顶对象. 以下是列表模拟栈的代码: <span style=" ...

微信模板消息接口、微信客服接口

客服接口:http://mp.weixin.qq.com/wiki/1/70a29afed17f56d537c833f89be979c9.html 模板消息接口:http://mp.weixin.qq ...

JS图片更换还原操作,通过图片识别标识

//图片更换还原操作,图片识别标识如图片img.png 可换成 img2.png function img_biaoshi(caozuo,img_id, biaoshi) { var img_src ...

access的逻辑类型

Alter TABLE [表名] ADD [新增字段] BOOLEAN或者Alter TABLE [表名] ADD [新增字段] YESNO 或者Alter TABLE [表名] ADD [新增字段] ...

构件图（Component Diagram）—UML图（八）

构件图是显示代码自身结构的实现级别的图表.构件图由诸如源码文件.二进制代码文件.可运行文件或动态链接库 (DLL) 这种构件构成,并通过依赖关系相连接以下这张图介绍了构件图的基本内容: 以下这张图是 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.