集群因子(Clustering Factor)

clustering factor是CBO使用的统计信息,用来衡量一个表中的列是否是规则排序存放的。

在通过索引访问表的时候,被用来作为代价评估的指示器。扫描索引的时候,clustering factor记录需要访问的数据块数量。

可以在以下数据字典中查看clustering factor:

-ALL|DBA|USER_INDEXES
-ALL|DBA|USER_IND_PARTITIONS
-ALL|DBA|USER_IND_SUBPARTITIONS

如何计算clustering factor:

1.按顺序扫描索引(可以通过dbms_rowid.rowid_block_number(rowid)找到记录对应的block号。索引中记录了rowid,因此oracle就可以根据索引中的rowid来判断记录是否是在同一个block中。)
2.当前索引行的rowid中block号与上一个索引行的rowid中的block号相比(即比较相邻rowid中的block号)
3.如果二者rowid中的block号不同,clustering factor计数器加一
4.如此比较所有的索引
5.最终的计数结果就是clustering factor的值。

举个例子,比如说索引中有a,b,c,d,e五个记录,首先比较a,b是否在同一个block,如果不在同一个block,那么Clustering Factor+1,然后继续比较b,c同理,如果b,c不在同一个block,那么Clustering Factor+1,这样一直进行下去,直到比较了所有的记录。根据算法我们就可以知道clustering factor的值介于block数和表行数之间。如果clustering factor接近block数,说明表的存储和索引存储排序接近,也就是说表中的记录很有序,这样在做index range scan的时候能,读取少量的data block就能得到我们想要的数据,代价比较小。如果clustering factor接近表记录数,说明表的存储和索引排序差异很大,在做index range scan的时候,会额外读取多个block,因为表记录分散,代价较高。

时间: 2024-10-21 23:19:42

集群因子(Clustering Factor)的相关文章

Oracle学习----集群因子(Clustering Factor)

1.集群因子的算法: 通过dbms_rowid.rowid_block_number(rowid)找到记录对应的block 号.索引中记录了rowid,因此oracle 就可以根据索引中的rowid来判断记录是否是在同一个block 中.举个例子,比如说索引中有a,b,c,d,e五个记录,首先比较a,b 是否在同一个block,如果不在同一个block 那么Clustering Factor +1,然后继续比较b,c 同理,如果b,c 不在同一个block,那么Clustering Factor

3、集群因子

预备知识: 索引是针对于列提出来的概念. 假设对object_id建立索引,就要将这一列的'值'和'rowid'一起放到索引中去.rowid就是表中某一行的物理地址(rowid=数据文件号+块号 [一个extent中rowid的值是递增的]). Oracle中表是堆表,表中的数据是无序的,但是索引中的数据是排序的.索引排序是根据键值来排序的. 集群因子是针对于索引提出来的概念. 集群因子: 集群因子是什么?集群因子是怎么算出来的? 索引中存放的是键值+rowid,我们来模拟一个索引的结构: 集群

Windows & RabbitMQ:集群(clustering) & 高可用(HA)

描述:我们需要配置三台服务器:ServerA, ServerB, ServerC 注意事项: 所有的服务器的Erlang版本,RabbitMQ版本必须一样 服务器名大小写敏感 Step 1:安装RabbitMQ 1. ServerA:Windows & RabbitMQ:安装,Step 1, 2, 3, 4, 5 2.ServerB, ServerC:Windows & RabbitMQ:安装,Step 1, 2 Step 2:修改ServerA, ServerB, ServerC的Hos

直方图、基数、选择性、群集因子

基本概念 基数(Cardinality) 列唯一键(Distinct_keys)的数量,比如性别,该列只有男女之分,所以这一列基数是2. 选择性(Selectivity) 列唯一键(Distinct_Keys)与行数(Num_Rows)的比值. 直方图 (Histogram)是一种对数据分布质量情况进行描述的工具.它会按照某一列不同值出现数量多少,以及出现的频率高低来绘制数据的分布情况,以便能够指导优化器根据数据的分布做出正确的选择. 频率直方图(FREQUENCY HISTOGRAM),当列中

rabbitmq 集群

搭建rabbitmq+HA 高可用集群 一.环境 centos6.5     192.168.9.27     rabbitmq1 centos6.5 192.168.9.28        rabbitmq2 centos6.5 192.168.9.29        rabbitmq3 二.每台服务器搭建单点rabbitmq 服务,见本博客地址:http://www.cnblogs.com/lzcys8868/p/7506251.html 端口说明:15672是管理界面用的:25672是集群

Linux CentOS6.5下RabbitMQ集群部署配置

一.服务器与主机名列表 环境:2台Linux主机,主机名和IP如下,rabbitmq执行用户为rabbitmq,所属组为rabbitmq 172.16.192.145   ecs003 172.16.192.146   ecs004 二.在个节点服务器上做好hosts解析 #cat>>/etc/hosts< 172.16.192.145   ecs003 172.16.192.146   ecs004 EOF 三.在各节点安装Rabbitmq 1.安装epel源和rabbit-relan

在CentOS7上部署Rabbitmq集群配置

概述 RabbitMQ是目前流行的开源消息队列系统.MQ(消息队列)是一种应用程序对应用程序的通信方法. RabbitMQ的结构图如图所示: 实现步骤 在一个集群里,有三台服务器,其中一台使用磁盘模式,另两台使用内存模式.两台内存模式的节点无疑速度更快,因此通过客户端连接访问它们.但是客户端不可能分别连接两个内存节点,肯定是通过前端反向代理去轮询分发请求如果担心前端反向代理服务器故障,可以通过Keepalived软件做一个高可用架构.而磁盘模式的节点,由于磁盘IO相对较慢,因此仅作数据备份使用.

PLSQL_性能优化系列15_Oracle Statistics统计信息

2014-12-18 BaoXinjian 一.摘要 Statistic 对Oracle 是非常重要的. 它会收集数据库中对象的详细信息,并存储在相应的数据字典里. 根据这些统计信息, optimizer 可以对每个SQL 去选择最好的执行计划. Statistic 对Oracle 是非常重要的,它会收集数据库中对象的详细信息,并存储在相应的数据字典里. 根据这些统计信息, optimizer 可以对每个SQL 去选择最好的执行计划. Oracle Statistic 的收集,可以使用analy

InnoDB关键特性之change buffer

一.关于IOT:索引组织表 表在存储的时候按照主键排序进行存储,同时在主键上建立一棵树,这样就形成了一个索引组织表,一个表的存储方式以索引的方式来组织存储的. 所以,MySQL表一定要加上主键,通过主键来访问MySQL表的性能是最好: 1.显式定义主键:primary key 2.隐式定义主键:如果没有指定主键,MySQL自己会默认建立一个主键(rowid隐藏主键) 1.特点 1.表按照主键排好序,数据按照主键顺序存放(核心原因) 2.主键上有一棵树,叶子节点就是数据节点 3.表本身就是索引,表