mysql 全文搜索(转载http://blog.csdn.net/manbujingxin/article/details/6656992)

前提:mysql只支持英文内容的全文索引,所以只考虑英文的全文搜索。假定数据表名为post,有三列:id、title、content。id是自增长序号,title是varchar,content是text,给content添加全文索引。

mysql全文搜索有三种模式:

一、自然语言查找。这是mysql默认的全文搜索方式,sql示例:

1 select  id,title FROM post WHERE MATCH(content) AGAINST (‘search keyword‘)

或者显式声明使用自然语言搜索方式

1 select  id,title FROM post WHERE MATCH(content) AGAINST (‘search keyword‘ IN NATURAL LANGUAGE MODE)

由于自然语言搜索方式是默认模式,所以可以省略声明模式的“IN NATURAL LANGUAGE MODE”部分。
自然语言搜索模式的么特点:

  • 忽略停词(stopword),英语中频繁出现的and/or/to等词被认为是没有实际搜索的意义,搜索这些不会获得任何结果。
  • 如果某个词在数据集中频繁出现的几率超过了50%,也会被认为是停词,所以如果数据库中只有一行数据,不管你怎么全文搜索都不能获得结果。
  • 搜索结果都具有一个相关度的数据,返回结果自动按相关度由高到低排列。
  • 只针对独立的单词进行检索,而不考虑单词的局部匹配,如搜索box时,就不会将boxing作为检索目标。

二、布尔查找。这种查找方式的特点是没有自然查找模式中的50%规则,即便有词语在数据集中频繁出现的几率超过50%,也会被作为搜索目标进行检索并返回结果,而且检索时单词的局部匹配也会被作为目标进行检索。sql示例

1 select  id,title FROM post WHERE MATCH(content) AGAINST (‘search keyword‘ IN BOOLEAN MODE)

三、带子查询扩展的自然语言查找。

1 select  id,title FROM post WHERE MATCH(content) AGAINST (‘search keyword‘ IN BOOLEAN MODE WITH EXPANSION)

暂时没有明白这种模式。

在我的实际使用中还发现了以下细节:

    • 布尔查找时必须指定返回结果的排序方式,它不会像自然语言查找那样会自动将结果按相关度排序返回。
    • 即使是布尔查找,对长度小于等于3的单词也不会进行检索,因为mysql有一个系统变量FT_MIN_WORD_LEN指定了全文检索时可接受的最小单词长度,默认值是4。.
时间: 2024-10-13 15:06:08

mysql 全文搜索(转载http://blog.csdn.net/manbujingxin/article/details/6656992)的相关文章

Win10双击调试 转载 http://blog.csdn.net/sagittarius_warrior/article/details/51305046

转:注1:本文非本人所写,尊重原作者劳动成果.仅是对原文备份. http://blog.csdn.net/sagittarius_warrior/article/details/51305046(原来链接出处) 注2:最近在双击调试,需要配置双击调试环境,经尝试,原作者提供的方法可行,故转载备份一张,方便记忆,再次感谢原作者,及李Sir( http://www.cnblogs.com/lzjsky/archive/2010/12/14/1905248.html),希望他们不要来打我,汗 本文章已

Windows下QT4.8.4编译环境的搭建(转载http://blog.csdn.net/bestgonghuibin/article/details/38933141)

开始使用QT了,所以第一步就是把环境搭起来,这里小记一下,以免以后忘记. 1. 下载安装文件 要使用QT功能,那么必须要下载QT的源码,还必须要一个是用QT的编译环境,可以是VS2010,也可以是专用于QT编程的QT Creator.本人选择QT Creator,所以也必须要下载QT Creator. 根据网上大部分教程及自己买的书籍获取的信息,在选择版本的时候,QT 源码选择4.8.4,而QT Creator选择2.8.0(QT5.0以后许多原有的文件路径改变). 选择好版本之后,可以上QT的

MyEclipse+Tomcat+MAVEN+SVN项目完整环境搭建(转载http://blog.csdn.net/zhshulin/article/details/30779873)

1.1新建变量名:JAVA_HOME   变量值:E:\Java\jdk1.6.0_43(这是我的jdk安装路径) 1.2编辑变量名:Path  在后面加上:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin 1.3 新建变量名:CLASSPATH 变量值: .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar (注意:在设置变量的末尾时不要加上":") ----------------

Uni2D 入门 -- Atlas转载 http://blog.csdn.net/kakashi8841/article/details/17588095

转载csdnTexture Atlas 我为什么应该使用Texture Atlas? 使用Atlas是一个普遍的好做法,而且它有很多好处.当有某些需要在屏幕渲染的时候,它背后带来的是draw call.由于不同的原因(例如渲染状态改变),一个draw call是一个很慢的操作,因此我们需要保持较低的draw call来保证较高的帧率.在移动设备上,接近30-40个draw call就开始变得危险了,具体取决于你的设备和渲染的场景. 幸运的是,在一些条件下,draw call是可以被批量处理的.u

用maven插件自动生成mybatis代码(转载http://blog.csdn.net/yinkgh/article/details/52512983)

1.在springmvc+mybatis项目的pom.xml文件中加如下内容,添加之后,maven会自动下载相关jar包,时间较长,需要耐心等待~~ <build> <plugins> <plugin> <groupId>org.mybatis.generator</groupId> <artifactId>mybatis-generator-maven-plugin</artifactId> <version>

调整分区大小 转载--------------http://blog.csdn.net/perfectzq/article/details/73606119

centos7重新调整分区大小 centos 7 调整 root 和 home 的容量大小 查看磁盘的空间大小: df -h  备份/home : cp -r /home/ homebak/ 卸载? /home : umount /home  如果出现 home 存在进程,使用 fuser -m -v -i -k /home 终止 home 下的进程,最后使用 umount /home 卸载 /home 删除/home所在的lv : lvremove /dev/mapper/centos-hom

java按照map的value排序 转载http://blog.csdn.net/tsingheng/article/details/7909861

java的TreeMap可以排序,只可惜是按照key来排序的,或者重写其他Map的排序算法也都是按照key来排序的,下面贴出来一个按照value排序的算法: [java] view plaincopy public class SortMap { public static void main(String[] args) throws Exception { // TODO code application logic here Map<String, Integer> myMap = ne

tomcat配置文件server.xml详解 转载http://blog.csdn.net/yuanxuegui2008/article/details/6056754

元素名 属性 解释 server port 指定一个端口,这个端口负责监听关闭tomcat 的请求 shutdown 指定向端口发送的命令字符串 service name 指定service 的名字 Connector ( 表示客户端和service之间的连接) port 指定服务器端要创建的端口号,并在这个断口监听来自客户端的请求 minProcessors 服务器启动时创建的处理请求的线程数 maxProcessors 最大可以创建的处理请求的线程数 enableLookups 如果为tru

java代码注释规范-----转载-----http://blog.csdn.net/shiyuezhong/article/details/8205281/

1 代码注释是架起程序设计者与程序阅读者之间的通信桥梁,最大限度的提高团队开发合作效率.也是程序代码可维护性的重要环节之一.所以我们不是为写注释而写注释.下面说一下我们在诉求网二期开发中使用的代码注释规范,供大家参考下. 2 3 原则: 4 1.注释形式统一 5 6 在整个应用程序中,使用具有一致的标点和结构的样式来构造注释.如果在其它项目中发现它们的注释规范与这份文档不同,按照这份规范写代码,不要试图在既成的规范系统中引入新的规范. 7 8 2.注释内容准确简洁 9 10 内容要简单.明了.含