Sphinx性能

(1)高速建立索引:建索引速度达到单核10-15mb/s; 
(2)高速查询:100万记录(约1.2GB数据)下,单核每秒支持约200次搜索; 
(3)高扩展性:已知最大索引簇支持对30亿条记录建立索引,每天单个连接5千万次搜索; 
(4)强大附属功能:支持分布式搜索,中文分词引擎,c/java/python/php等多语言支持,支持MySQL,也可以自建索引(xml pipe mechanism)支持KV等其他存储。

(5)高性能搜索(在2-4 GB的文本上搜索,平均0.1秒内获得结果)

(6)高扩展性(实测最高可对100GB的文本建立索引,单一索引可包含1亿条记录)

(7)支持分布式检索

(8)支持基于短语和基于统计的复合结果排序机制

(9)支持任意数量的文件字段(数值属性或全文检索属性)

(10)支持不同的搜索模式(“完全匹配”,“短语匹配”和“任一匹配”)

  • 支持作为Mysql的存储引擎
时间: 2024-10-08 12:18:07

Sphinx性能的相关文章

2014年终工作总结及2015年工作计划--激励

习惯了总结,习惯了计划,没有总结就没法把零散的经验体系化,到头来是只见树木不见森林:没有计划就没有目标,没有目标人就容易颓废,到头来是王茂法贴春联一年又是一年.对于运维工作更是如此,运维是自我驱动的,而开发是需求驱动的,这有有很大的不同:运维涉及的知识面极为广泛.具体的工作也是异常分散.不可预知的突发事件更是让你措手不及,没有总结工作起来很痛苦,总是扮演消防员的角色:经过几年的发展,运维基础设施系统等大部分工作通过脚本.系统实现了自动化,很大程度的解放了运维的重复劳动,这个时候很容易无所事事.惶

php+中文分词scws+sphinx+mysql打造千万级数据全文搜索

Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果 相关度的全文搜索功能.Sphinx可以非常容易的与SQL数据库和脚本语言集成.当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式 的XML数据.Sphinx创建索引的速度为:创建100万条记录的索引只需3-4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒.Sphinx的

性能调优攻略

关于性能优化这是一个比较大的话题,在<由12306.cn谈谈网站性能技术>中我从业务和设计上说过一些可用的技术以及那些技术的优缺点,今天,想从一些技术细节上谈谈性能优化,主要是一些代码级别的技术和方法.本文的东西是我的一些经验和知识,并不一定全对,希望大家指正和补充. 在开始这篇文章之前,大家可以移步去看一下酷壳以前发表的<代码优化概要>,这篇文章基本上告诉你--要进行优化,先得找到性能瓶颈! 但是在讲如何定位系统性能瓶劲之前,请让我讲一下系统性能的定义和测试,因为没有这两件事,后

sphinx 配置文件全解析

source:数据源,数据是从什么地方来的. index:索引,当有数据源之后,从数据源处构建索引.索引实际上就是相当于一个字典检索.有了整本字典内容以后,才会有字典检索. searchd:提供搜索查询服务.它一般是以deamon的形式运行在后台的. indexer:构建索引的服务.当要重新构建索引的时候,就是调用indexer这个命令. attr:属性,属性是存在索引中的,它不进行全文索引,但是可以用于过滤和排序. sphinx的配置文件过于冗长,我们把sphinx默认的配置文件中的注释部分去

Sphinx + Coreseek 实现中文分词搜索

Sphinx + Coreseek 实现中文分词搜索 Sphinx Coreseek 实现中文分词搜索 全文检索 1 全文检索 vs 数据库 2 中文检索 vs 汉化检索 3 自建全文搜索与使用Google等第三方站点提供的站内全文搜索的差别 Sphinx Coreseek介绍 Coreseek安装使用 1. 全文检索 1.1 全文检索 vs. 数据库 全文检索是数据库的有力补充,全文检索并不能替代数据库在应用系统中的作用.当应用系统的数据以大量的文本信息为主时,採用全文检索技术能够极大的提升应

sphinx SPH_MATCH_EXTENDED2 基本应用

匹配模式 有如下可选的匹配模式: SPH_MATCH_ALL, 匹配所有查询词(默认模式); SPH_MATCH_ANY, 匹配查询词中的任意一个; SPH_MATCH_PHRASE, 将整个查询看作一个词组,要求按顺序完整匹配; SPH_MATCH_BOOLEAN, 将查询看作一个布尔表达式 SPH_MATCH_EXTENDED, 将查询看作一个CoreSeek/Sphinx内部查询语言的表达式 . 从版本Coreseek 3/Sphinx 0.9.9开始, 这个选项被选项SPH_MATCH_

【MySQL】性能优化 之 延迟关联

[背景]  某业务数据库load 报警异常,cpu usr 达到30-40 ,居高不下.使用工具查看数据库正在执行的sql ,排在前面的大部分是: SELECT id, cu_id, name, info, biz_type, gmt_create, gmt_modified,start_time, end_time, market_type, back_leaf_category,item_status,picuture_url FROM relation where biz_type ='0

Sphinx学习之sphinx的安装篇

一.  Sphinx简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果 相关度的全文搜索功能.Sphinx可以非常容易的与SQL数据库和脚本语言集成.当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式 的XML数据. Sphinx的特性如下: a)  高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒); b)  高性能的搜索(在2 – 4GB 的文本数据上,平均每

开源搜索引擎评估:lucene sphinx elasticsearch

目录(?)[+] 开源搜索引擎评估:lucene sphinx elasticsearch 开源搜索引擎程序有3大类 lucene系,java开发,包括solr和elasticsearch sphinx,c++开发,简单高性能 Xapian,c++开发 搜索引擎程序这个名称不妥当,严格说来应该叫做索引程序(indexing program),早期主要用来做中文全文搜索,但是随着互联网的深入普及,各家网站规模越来越大,索引程序在 优化网站架构上发挥了更大的作用:替代mysql数据库内置的索引 让m