建索引时优化的观察和思考

同事调整了IndexWriterConfig的maxThreadStates参数，发现性能有很大提升，原来之前一直没去注意这个东西。

addDocument时默认会调用ThreadAffinityDocumentsWriterThreadPool来获取线程锁,而这个线程池默认是8个线程，如果同时addDocument的线程多于8个，则线程处在等待锁的状态(一般是等最小竞争的>锁)，所以本质上要在indexwriterconfig中增加最大索引线程数。

Lucene中还存在一个FlushStallControl,用于平衡addDocument和flush之间的速度差,如果flushBytes + activeBytes > 2 * ramBytes，且flushBytes > 0,则addDocument线程被暂停，直到flush完成。这有一个启发，最好监控下等待时间,如果等待时间太长，是不是考虑硬盘换一下?

另外使用LogByteMergePolicy的确比LogDocMergePolicy好，原因是这样内存平稳一点，表现略好。RamBufferSize是个很微妙的参数,理论上越大,索引归并的趟数越少，有利于减少归并时间,对建索引本身速度的影响，考虑addDocument和flush的平衡这一瓶颈，如果硬盘使用ssd(即等待时间变得超短,而且很少等待)，段应该大一点好?这好像很难说清，从小索引测试结果来看，200M左右性能最好。

建索引时优化的观察和思考

时间： 2024-12-12 23:04:23

建索引时优化的观察和思考的相关文章

java web轻量级开发面试教程读书笔记：建索引时我们需要权衡的因素

场景一,数据表规模不大,就几千行,即使不建索引,查询语句的返回时间也不长,这时建索引的意义就不大.当然,若就几千行,索引所占的空间也不多,所以这种情况下,顶多属于"性价比"不高. 场景二,某个商品表里有几百万条商品信息,同时每天会在一个时间点,往其中更新大概十万条左右的商品信息,现在用where语句查询特定商品时(比如where name = 'XXX')速度很慢.为了提升查询效率可以建索引,但当每天更新数据时,又会重建索引,这是要耗费时间的. 这时就需要综合考虑,甚至可以在更新前删除

使用NOSQL的MongoDB时建立索引需要注意的几点建议和Explain优化分析

第一,MongoDB索引和MySQL索引非常相似并且对于MySQL的索引优化有很多也适用于MongoDB. 第二,更重要的是,这些索引的建立对你的应用提高也是有限的. 对于应用的最佳索引策略应该基于很多的重要因素.包含了你期望查询的类型, 数据读取与写入的比率,甚至于你服务器的空闲内存.意思就是, 需要对线上的产品做很多的测试剖析工作,才能调整出最佳的索引策略. 没有什么好的方法可以替代实际经验的. 索引策略下面有些索引的基本法则创建的索引要匹配查询. 如果你仅仅要查询单个字段.索引这个字段

Oracle使用并行建索引须要注意的问题

建索引时.我们为了建索引快.会加上并行,加上并行之后.此列索引就会是并行了. 訪问有并行度的索引时,CBO可能可能会考虑并行运行.这可能会引发一些问题,如在server资源紧张的时候用并行会引起更加严重的争用.当使用并行后,须要把并行度改回来. SQL> drop table test purge; SQL> create table test as select * from dba_objects; SQL> create index ind_t_object_id on test(

Oracle使用并行建索引需要注意的问题

建索引时,我们为了建索引快,会加上并行,加上并行之后,此列索引就会是并行了.访问有并行度的索引时,CBO可能可能会考虑并行执行,这可能会引发一些问题,如在服务器资源紧张的时候用并行会引起更加严重的争用.当使用并行后,需要把并行度改回来. SQL> drop table test purge; SQL> create table test as select * from dba_objects; SQL> create index ind_t_object_id on test(obje

mongodb建索引引起的问题

建索引就是一个容易引起长时间写锁的问题,MongoDB 在前台建索引时需要占用一个写锁(而且不会临时放弃),如果集合的数据量很大,建索引通常要花比较长时间,特别容易引起问题. 解决的方法很简单,MongoDB提供了两种建索引的访问,一种是 background 方式,不需要长时间占用写锁,另一种是非 background 方式, 需要长时间占用锁.使用background 方式就可以解决问题. 例如,为超大表 posts 建立索引, 千万不用使用 db.posts.ensureIndex({us

INDEX--创建索引和删除索引时的SCH_M锁

最近有一个困惑,生产服务器上有一表索引建得乱七八糟,经过整理后需要新建几个索引,再删除几个索引,建立索引时使用联机(ONLINE=ON)创建,查看下服务器负载(磁盘和CPU压力均比较低的情况)后就选择业务时间创建,但是到删除索引时却遇到问题:阻塞,删除索引需要架构修改锁(SCH_M),有阻塞很正常,虽然查询使用NOLOCK提示降低了对其他会话的影响,但还是会在页或表上生成一些意向共享锁(IS),这些意向共享锁与SCH_M无法兼容,因此阻塞无可避免,悲催的是在该表上多个会话重复执行查询且该查询执行

Django—— ORM查询(sql优化)优化了解，Django(元信息)元类建索引

Django(元信息)元类建索引索引:索引的一个主要目的就是加快检索表中数据,索引是经过某种算法优化过的,因而查找次数要少的多.可见,索引是用来定位的. class Book(models.Model) name = models.CharField(max_length=64) class Meta: # 自定义表名 db_table = 'table_name' # 联合索引: 索引的一个主要目的就是加快检索表中数据 index_together = ('tag1', 'tag2') #

mysql性能优化-索引与优化

http://hongge.blog.51cto.com/ 一.MySQL性能优化之-影响性能的因素 1.商业需求的影响不合理需求造成资源投入产出比过低,这里我们就用一个看上去很简单的功能来分析一下. 需求:一个论坛帖子总量的统计,附加要求:实时更新从功能上来看非常容易实现,执行一条SELECT COUNT(*) from 表名的Query 就可以得到结果.但是,如果我们采用不是MyISAM 存储引擎,而是使用的Innodb 的存储引擎,那么大家可以试想一下,如果存放帖子的表中已经有上千万

数据库理论之视图、事务、索引、优化查询

数据库理论之视图.事务.索引.优化查询一.视图灵魂三问 1.什么是视图视图就是通过查询得到一张虚拟表,然后保存下来,下次直接使用即可 2.为什么要用视图如果要频繁的使用一张虚拟表,可以不用重复查询 3.如何使用视图 create view 视图名 as sql语句注意:创建出来的视图只有表结构,数据来源还是原来的表视图通常都是用于查询,所以尽量不要修改视图中的数据思考:开发过程中应不应该使用视图? 不应该二.触发器命名规则及理论在满足对某张表数据的增删改的情况下,自动触发的功

猜你喜欢

用Editplus开发Java

☆ 准备工作 ①,已安装好jdk,同时配置系统变量(3个,JAVA_HOME,PATH,CLASSPATH) ②,电脑已安装Editplus,并做好设置. ☆ Editplus配置java开发环境对 ...

Java的多线程编程模型5--从AtomicInteger开始

Java的多线程编程模型5--从AtomicInteger开始 2011-06-23 20:50 11393人阅读评论(9) 收藏举报 java多线程编程jniinteger测试 AtomicIn ...

spark中的广播变量broadcast

Spark中的Broadcast处理首先先来看一看broadcast的使用代码: val values = List[Int](1,2,3) val broadcastValues = sparkC ...

如何初始化类的static成员变量？

类的static成员变量不被某一个对象所独有,而是被所有同类型的对象所共有. 只能在头文件中声明类的static成员变量,不可在头文件中初始化,否则会造成重定义.必须在另外一个.cpp文件中进行初始化 ...

MAC下搭建MySQL环境

系统版本:OS X El Capitan MySQL版本:MySQL Community Server(GPL) (mysql-5.7.13-osx10.11-x86_64.dmg) /*官网下 ...

【转】emulator: ERROR: Could not load OpenGLES emulation library: lib64OpenglRender.so

[转]emulator: ERROR: Could not load OpenGLES emulation library: lib64OpenglRender.so 1 ./emulator64-a ...

单片机IO口标准双向，推挽，高阻，开漏模式，LED感应亮灭实验【原创！】

单片机IO口标准双向,推挽,高阻,开漏模式 ,LED感应亮灭实验十一长假在家快烂了,没事儿做,DIY技术搞起来! [关于12C增强型单片机I/O口的工作类型实验研究] 文中动画视频效果下载: S ...

POJ3581---Sequence 后缀树组

题意:n个数字组成的序列,第一个数字最大,,把序列分成3部分,每个部分分别翻转,输出翻转后字典序最小的序列.. 后缀数组变一下,,先求出第一个分割的位置,,然后再求一次后缀数组,,求出第二个位置.. ...

朴素贝叶斯算法及实现

1.朴素贝叶斯算法介绍一个待分类项x=(a,b,c...),判断x属于y1,y2,y3...类别中的哪一类. 贝叶斯公式: 算法定义如下: (1).设x={a1, a2, a3, ...}为一个待分 ...

进程和线程、协程的区别

现在多进程多线程已经是老生常谈了,协程也在最近几年流行起来.python中也有协程库,tornado中也用了gevent封装好的协程.本文主要介绍进程.线程和协程三者之间的区别. 一.概念 1.进程 ...

Catch---hdu3478（染色法判断是否含有奇环）

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3478 题意:有n个路口,m条街,一小偷某一时刻从路口 s 开始逃跑,下一时刻都跑沿着街跑到另一路口,问 ...

pcurl 学习 http文件下载及写入空设备文件实例

import pycurl import sys import os import random import string import time class Transaction(object) ...

HDU 5936 Difference 【中途相遇法】（2016年中国大学生程序设计竞赛（杭州））

Difference Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total ...

FS，FT，DFS，DTFT，DFT，FFT的联系和区别

对于初学数字信号处理(DSP)的人来说,这几种变换是最为头疼的,它们是数字信号处理的理论基础,贯穿整个信号的处理. 学习过<高等数学>和<信号与系统>这两门课的朋友,都知道时域 ...

md5增加指定的加密规则，进行加密

import java.io.UnsupportedEncodingException; import java.security.MessageDigest; import java.securit ...

彻底弄懂css中单位px和em，rem的区别

PX:PX实际上就是像素,用PX设置字体大小时,比较稳定和精确.但是这种方法存在一个问题,当用户在浏览器中浏览我们制作的Web页面时,如果改变了浏览器的缩放,这时会使用我们的Web页面布局被打破.这样 ...

Android-Launcher开发之ShortCut(1)

以下源码来自Launcher2.3的例子 1.默认每个应用的主Activity都会自带 <category android:name="android.intent.category. ...

类继承super原理

super 原理 super 的工作原理如下: def super(cls, inst): mro = inst.__class__.mro() return mro[mro.index(cls) + ...

Windows 服务快捷启动命令

gpedit.msc-----组策略sndrec32-----录音机nslookup----- ip地址侦测器explorer------ 打开资源管理器logoff-------注销命令tsshut ...

5.3（2）----机器人走方格2（CC150）

这道题只需要把障碍点都设为0就可以了. public static int countWays(int[][] map,int x, int y){ if( x < 0 || y < 0) ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.