关于SQLSERVER的全文目录跟全文索引的区别

很久没有写随笔了,本来之前想写一篇关于SQLSERVER全文索引的随笔,可惜没有时间,一直拖到现在才有时间写,不好意思让各位久等了~

先介绍一下SQLSERVER中的存储类对象,哈哈,先介绍一下概念嘛,让新手老手都有一个认知

SQLSERVER Management Studio将【全文目录】、【分区函数】以及【分区方案】节点纳入其【对象资源管理器】的【存储】节点之中,

如下图所示:

正文来了!哈哈,有请主角:全文目录

全文目录

数据库【存储】|【全文目录】节点是用于保存和管理【全文索引】的节点。全文目录通常是由同一数据库中的零个或多个数据表的全文索引构成的。

需要注意的是,只能为每个数据表创建一个全文索引。因此,一旦在某个数据表上创建了全文索引,那么该数据表将只能隶属于一个全文目录。换言之,

一个数据库可以包含一个或多个全文目录,一个全文目录可以包含一个或多个全文索引,但一个数据表只能有一个数据库全文目录和全文索引(跟mysql一样)。

在SQLSERVER2005中使用全文索引的主要步骤如下

(1)首先需要创建全文目录。

(2)然后将需要创建全文索引的数据表中的数据填充到全文目录中。这一过程也被称为填充全文索引。

(3)完成上述两步之后,即可开始使用全文索引功能。

创建全文目录的方法非常简单。通过SSMS以及T-SQL都可以实现创建全文目录的功能。

至于具体的创建步骤嘛,这里就不说了,网上都有文章说明,我就不转载了

最后说一下全文索引的优缺点和注意事项

(1)全文索引可对char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型字段进行检索,

是解决海量数据模糊查询的好办法。

(2)一个表只能建立一个全文索引(但可以对多个字段)。

(3)与like的比较 MSDN解释

与全文搜索不同,LIKE Transact-SQL 谓词仅对字符模式( char、varchar、nchar、nvarchar)有效。另外,不能使用 LIKE 谓词来查询格式化的二进制数据。此外,对大量非结构化的文本数据执行 LIKE 查询要比对相同数据执行同样的全文查询慢得多。对数百万行文本数据进行的 LIKE 查询可能需要几分钟的时间才能返回结果;而对于同样的数据,全文查询只需要几秒甚至更少的时间,具体取决于返回的行数及其大小。另一个考虑因素是 LIKE 仅对整个表执行简单模式扫描。相反,全文查询可识别语言,它在索引和查询时应用特定的转换,例如,筛选非索引字并进行同义词库和变形扩展。这些转换可帮助全文查询改进其撤回以及结果的最终排名

最最后,讲一下全文索引的用法

SQL Server 2000和SQLSERVER2005提供的全文检索语句主要有CONTAINS和FREETEXT。 (1)CONTAINS语句的功能是在表的所有列或指定列中搜索:一个字或短语;一个字或短语的前缀;与一个字相近的另一个字;一个字的派生字;一个重复出现的字。

(2)FREETEXT语句的功能是在一个表的所有列或指定列中搜索一个自由文本格式的字符串,并返回与该字符串匹配的数据行。所以,FREETEXT语句所执行的功能又称做自由式全文查询。

T-SQL语句

1 USE pratice
2
3 SELECT *  FROM  dbo.test WHERE CONTAINS(d,‘基数行‘)

pratice是我的一个测试数据库,d是test表的其中一个字段,以上T-SQL语句的意思是查找d字段里包含字符串"基数行"的记录

--下列 T-SQL 指令碼示範查詢全文檢索索引狀態以及其內容。

SELECT * FROM sys.dm_fts_index_population

SELECT * FROM sys.dm_fts_index_keywords( DB_ID(‘tde‘), OBJECT_ID(‘SalesLT.Product‘))

http://blogs.technet.com/b/technet_taiwan/archive/2015/06/02/sql-database-new-features-tde-and-full-text-search.aspx

填充的方式有3种:1、完全填充,2、增量填充,3、自动跟踪更改



f

f

f

f

f

sql2008 的全文索引现在是存储在数据库中 全文索引基于CHAR/VARCHAR/NVARCHAR/XML/VARBINARY 提供了50个筛选器 全文索引使用语言特有的断字符word breaker 和词干分析器stemmer 指定具体语言,单词之间的breaker 被排除在常用单词(字)外面的单词(字)称为干扰词stop word,通过指定干扰词避免大量根本算不上关键字的单词(字)所干扰 一个表/索引视图只能有一个全文索引 stemmer   n. 抽梗机,除梗器;抽梗工人

一定要使用单独的文件组来存放全文目录!



f

f

f

f

f

全文索引填充不是即时完成的,因为数据必须提交给索引引擎,再由索引引擎应用断字符,词干分析器,语言文件,干扰词列表stop lists,最后才将更改合并到索引 merge到索引

语言规范决定了由全文索引引擎需要加载的断字符和词干分析器

SQL2008有第三方断字符和词干分析器

断字符还能识别数据中的单词之间的距离,这种接近性(proximity)添加到全文数据中,mysql的全文也有近似性,这是全文索引的独有功能,like%%是做不到的

sqlserver使用词干分析器来识别关键词的各种形式变化

f



f

f

f

f

f

f

f

全文谓词(全文搜索关键词)提交给全文索引引擎,全文索引引擎利用断字符word breaker标记搜索关键词,加token,将数据返回给优化器

where后面的谓词,如果不是全文,就叫谓词,如果是全文就是全文谓词

language参数指定是,是哪一个国家语言

优化器不能通过参数嗅探来计算全文索引上的分别统计数据,为了获得最佳性能必须给全文搜索的所有关键字都是Unicode类型

同义词文件



f

f

f

f

f

f

f

f

f

f

创建同义词XML文件 添加干扰词列表 重建全文索引 干扰词列表stop list或noise word file 如果你在一个全文谓词中提交的参数是干扰词,查询不会返回任何结果(而且他根本不需要访问底层数据) sql2005和更早版本在FTDATA文件夹下配置干扰词文件,sql2008的干扰词列表存放在sqlserver的一个数据库中

增量填充全文索引必须要有一个时间戳

同义词和干扰词存放路径 C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData

C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData文件夹下只有两种文件:同义词和干扰词存

干扰词列表stop list或noise word file或stop word

全文关键术语

f

f

f

f

原文地址:https://www.cnblogs.com/cuihongyu3503319/p/9093057.html

时间: 2024-10-10 17:52:53

关于SQLSERVER的全文目录跟全文索引的区别的相关文章

解决SQL Server Management Studio Express不支持更新全文目录的方法

微软的说法:https://msdn.microsoft.com/zh-cn/library/ms365247.aspx 可以用命令创建: A.创建唯一索引.全文目录和全文索引 以下示例对 AdventureWorks2012 示例数据库中 HumanResources.JobCandidate 表的 JobCandidateID 列创建全文索引. 然后,该示例创建一个默认全文目录 ft. 最后,该示例使用 ft 目录和系统非索引字表对 Resume 列创建全文索引. 复制 USE Advent

反骨仔的全文目录索引(持续整理中...)

反骨仔的全文目录索引 目录 C# 基础回顾 .NET 相关 SQL 基础梳理 其它 - 暂无分类 C# 基础回顾 C# 知识回顾 - 序列化 C# 知识回顾 - 表达式树 Expression Trees C# 知识回顾 - 特性 Attribute 走进 LINQ 的世界 进阶 - LINQ 标准查询操作概述 Linq To Objects - 如何操作文件目录 Linq To Objects - 如何操作字符串 C# 知识回顾 - 特性 Attribute 剖析 AssemblyInfo.c

反骨仔的全文目录索引

反骨仔的全文目录索引 目录 C# 基础回顾 .NET 相关 SQL 基础梳理 其它 - 暂无分类 C# 基础回顾 C# 知识回顾 - 序列化 C# 知识回顾 - 表达式树 Expression Trees C# 知识回顾 - 特性 Attribute 走进 LINQ 的世界 进阶 - LINQ 标准查询操作概述 Linq To Objects - 如何操作文件目录 Linq To Objects - 如何操作字符串 剖析 AssemblyInfo.cs - 了解常用的特性 Attribute 走

全文目录

由于生活的原因,找工作啊,找住房啊,所以停下来很长一段时间. 虽然没有写博客,但是我也在思考很多问题,其中值得拿来在这里说的是:为什么要写博客. 一开始写博客纯碎是看着大神都写,纯碎的模仿.效仿,追随别人的脚步,然后到现在,我发现不是这样了,写博客至少有两点原因: 1. 用于总结! 2. 提升思维能力! (过多的话,我就不再说了) 以下是经过重新编排,整理后,决定建立的博客索引,本博客的所有博文以及目录从此处展开. Content List: Java基础 Java与模式  Java数据结构与算

SQLserver 转换Mysql 一些语法使用的区别

1.存储过程的语法各式eg:DELIMITER $$ CREATE PROCEDURE test_p_add9( p_name VARCHAR(100), p_test VARCHAR(100), p_age INT, OUT o_newid INT) BEGIN INSERT INTO table_test (f_name,f_test,f_age,f_date) VALUES (p_name,p_test,p_age,NOW()); SET o_newid=LAST_INSERT_ID();

( 转)Sqlserver中tinyint, smallint, int, bigint的区别 及 10进制转换16进制的方法

一.类型比较 bigint:从-2^63(-9223372036854775808)到2^63-1(9223372036854775807)的整型数据,存储大小为 8 个字节.一个字节就是8位,那么bigint就有64位 int:从-2^31(-2,147,483,648)到2^31-1(2,147,483,647)的整型数据,存储大小为 4 个字节.int类型,最大可以存储32位的数据 smallint:从-2^15(-32,768)到2^15-1(32,767)的整数数据,存储大小为 2 个

Linux 目录中/和~的区别

/指根目录,即所有目录最顶层的目录.~是当前用户的主目录:如果是root用户,则是/root/目录:如果是其他用户,则是/home/下用户名命名的目录,例如登录用户是test,~代表/home/test/. 参考资料 Linux目录中/和~的区别 linux中 ~/. 是什么目录? 原文地址:https://www.cnblogs.com/WJQ2017/p/9519951.html

【T-SQL】系列文章全文目录(2017-06-02更新)

本系列[T-SQL]主要是针对T-SQL的总结. T-SQL基础 [T-SQL基础]01.单表查询-几道sql查询题 [T-SQL基础]02.联接查询 [T-SQL基础]03.子查询 [T-SQL基础]04.表表达式-上篇 [T-SQL基础]04.表表达式-下篇 [T-SQL基础]05.集合运算 [T-SQL基础]06.透视.逆透视.分组集 [T-SQL基础]07.数据修改 [T-SQL基础]08.事务和并发 [T-SQL基础]09.可编程对象 T-SQL进阶 [T-SQL进阶]01.好用的SQ

114、drawable和mipmap 目录下图片的区别

android 在 API level 17 加入了 mipmap 技术,对 bitmap 图片的渲染支持 mipmap 技术,来提高渲染的速度和质量.mipmap 是一种很早就有的技术了,翻译过来就是纹理映射技术.android 中的 mipmap 技术主要为了应对图片大小缩放的处理,在android 中我们提供一个 bitmap 图片,由于应用的需要(比如缩放动画),可能对这个 bitmap 进行各种比例的缩小,为了提高缩小的速度和图片的质量,android 通过 mipmap 技术提前对按