postgresql之ctid的浅谈

ctid：表示数据记录的物理行当信息，指的是一条记录位于哪个数据块的哪个位移上面。跟oracle中伪列 rowid 的意义一样的；只是形式不一样。

例如这有个一表test；查看每行记录的ctid情况

mydb=> select ctid,* from test;
 ctid  |  id  |  name
-------+------+--------
 (0,1) | 1001 | lottu
 (0,2) | 1002 | rax
 (0,3) | 1003 | xuan
 (0,4) | 1004 | li0924
 (0,5) | 1001 | ak

格式(blockid,itemid)：拿其中(0,1)来说；0表示块id；1表示在这块第一条记录。

1. 去重：我们知道rowid在oracle有个重要的作用；被用作表记录去重；同理 ctid在postgresql里面同样可以使用。例如test表id为1001有两条记录；现在演示下；

mydb=> delete from test where ctid not in (select min(ctid) from test group by id);
DELETE 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name
-------+------+--------
 (0,1) | 1001 | lottu
 (0,2) | 1002 | rax
 (0,3) | 1003 | xuan
 (0,4) | 1004 | li0924
(4 rows)

刚刚我们删除了(0,5)这条记录；现在我们把这条记录插入下；看下；

mydb=> insert into test values (1001,‘ak‘);
INSERT 0 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name
-------+------+--------
 (0,1) | 1001 | lottu
 (0,2) | 1002 | rax
 (0,3) | 1003 | xuan
 (0,4) | 1004 | li0924
 (0,6) | 1001 | ak
(5 rows)

奇怪了；为什么不是(0,5),而是(0,6)这个跟postgresql多版本事务有关；跟伪列cmin，cmax有关；跟本文讲的ctid没点关系；这是postgresql的特性；也就是这样；postgresql里面没有回滚段的概念；那怎么把(0,5)在显示呢；想这块(0,5)的空间再存放数据；postgresql里面有AUTOVACUUM进程；当然我们也可以手动回收这段空间；

mydb=> delete from test where name = ‘ak‘;
DELETE 1
mydb=> vacuum test;
VACUUM
mydb=> insert into test values (1001,‘ak‘);
INSERT 0 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name
-------+------+--------
 (0,1) | 1001 | lottu
 (0,2) | 1002 | rax
 (0,3) | 1003 | xuan
 (0,4) | 1004 | li0924
 (0,5) | 1001 | ak
(5 rows)

2. 我们刚刚说道 0表示块id； test数据太少了；不好解释；新建一个表test2

mydb=> drop table test2;
DROP TABLE
mydb=> create table test2 (id int primary key, name varchar(10));
CREATE TABLE
mydb=> insert into test2 select generate_series(1,1000),‘lottu‘ || generate_series(1,1000);
INSERT 0 1000

我们看下id=1000的ctid的blockid是多少；答案是5；意思是说该表的记录记录到第6个块；（因为是从0开始的）

mydb=> select ctid,* from test2 where id = 1000;
  ctid  |  id  |   name
--------+------+-----------
 (5,75) | 1000 | lottu1000
(1 row)

当然这样查表记录占了几个block；假如我这是随机插入的；那id=1000；就不一定是在第6块；

我们可以借助系统视图pg_class；其中relpages,reltuples分别代表块数，记录数！

mydb=> analyze test2;
ANALYZE
mydb=> select relpages,reltuples from pg_class where relname = ‘test2‘;
 relpages | reltuples
----------+-----------
        6 |      1000
(1 row)

总结： ctid存在的意义：表示数据记录的物理行当信息，指的是一条记录位于哪个数据块的哪个位移上面。跟oracle中伪列 rowid 的意义一样的；只是形式不一样。

vacuum: 回收未显示的物理位置；标明可以继续使用。

generate_series: 为一个序列函数；例如1-100；就是generate_series(1,100);0-100直接的偶数generate_series(0,100,2)

其中的0表示序列开始位置；100代表结束位置；2为偏移量。

时间： 2024-12-14 09:36:07

postgresql之ctid的浅谈的相关文章

浅谈数据库框架,见笑,请多指正

浅谈数据库框架,见笑,请多指正 http://weibo.com/p/1001603724746155003486 一友说"插件式存储又割裂了SQL引擎的完整逻辑...总体而言在现有框架下MySQL的优化器没有多大改进的价值". 我们且做个技术分析: 1 插件式框架,可以静态/动态加载组件,方便在同类不同属家的模块间切换,这种设计是良好的. 很多软件的设计都采用了"微内核+插件"这样的方式构筑了强大的应用.如Ecplise生态圈. 2 数据库范围内, MySQL的属

蚂蚁变大象：浅谈常规网站是如何从小变大的（六）（转）

原文:http://blog.sina.com.cn/s/blog_6203dcd60100xvky.html [第十阶段 : 数据存储优化] 在前面的阶段中,我们都使用数据库作为默认的存储引擎,很少谈论关于关于数据存储的话题.但是,数据的存储却是我们现在众多大型网站面临的最核心的问题.现在众多网络巨头纷纷推出自己的"高端"存储引擎,也吸引了众多的眼球.比如:google的BigTable.facebook的cassandra.以及开源的Hadoop等等.国内众多

浅谈数据库并发控制 - 锁和 MVCC

在学习几年编程之后,你会发现所有的问题都没有简单.快捷的解决方案,很多问题都需要权衡和妥协,而本文介绍的就是数据库在并发性能和可串行化之间做的权衡和妥协 - 并发控制机制. 如果数据库中的所有事务都是串行执行的,那么它非常容易成为整个应用的性能瓶颈,虽然说没法水平扩展的节点在最后都会成为瓶颈,但是串行执行事务的数据库会加速这一过程:而并发(Concurrency)使一切事情的发生都有了可能,它能够解决一定的性能问题,但是它会带来更多诡异的错误. 引入了并发事务之后,如果不对事务的执行进行控制就会

浅谈openresty

浅谈openresty 为什么会有OpenResty? 我们都知道Nginx有很多的特性和好处,但是在Nginx上开发成了一个难题,Nginx模块需要用C开发,而且必须符合一系列复杂的规则,最重要的用C开发模块必须要熟悉Nginx的源代码,使得开发者对其望而生畏.为了开发人员方便,所以接下来我们要介绍一种整合了Nginx和lua的框架,那就是OpenResty,它帮我们实现了可以用lua的规范开发,实现各种业务,并且帮我们弄清楚各个模块的编译顺序. OpenResty(又称:ngx_openre

.net中对象序列化技术浅谈

.net中对象序列化技术浅谈 2009-03-11 阅读2756评论2 序列化是将对象状态转换为可保持或传输的格式的过程.与序列化相对的是反序列化,它将流转换为对象.这两个过程结合起来,可以轻松地存储和传输数据.例如,可以序列化一个对象,然后使用 HTTP 通过 Internet 在客户端和服务器之间传输该对象.反之,反序列化根据流重新构造对象.此外还可以将对象序列化后保存到本地,再次运行的时候可以从本地文件中“恢复”对象到序列化之前的状态.在.net中有提供了几种序列化的方式:二进制序列化

浅谈——页面静态化

现在互联网发展越来越迅速,对网站的性能要求越来越高,也就是如何应对高并发量.像12306需要应付上亿人同时来抢票,淘宝双十一--所以,如何提高网站的性能,是做网站都需要考虑的. 首先网站性能优化的方面有很多:1,使用缓存,最传统的一级二级缓存:2,将服务和数据库分开,使用不同的服务器,分工更加明确,效率更加高:3,分布式,提供多台服务器,利用反向代理服务器nginx进行反向代理,将请求分散开来:4,数据库的读写分离,不同的数据库,将读操作和写操作分开,并实时同步即可:5,分布式缓存,使用memc

单页应用SEO浅谈

单页应用SEO浅谈前言单页应用(Single Page Application)越来越受web开发者欢迎,单页应用的体验可以模拟原生应用,一次开发,多端兼容.单页应用并不是一个全新发明的技术,而是随着互联网的发展,满足用户体验的一种综合技术. SEO 一直以来,搜索引擎优化(SEO)是开发者容易忽略的部分.SEO是针对搜索(Google.百度.雅虎搜索等)在技术细节上的优化,例如语义.搜索关键词与内容相关性.收录量.搜索排名等.SEO也是同行.市场竞争常用的的营销手段.Google.百度的搜

浅谈html标签

浅谈html各常用标签用法标题标签:<h1>-<h6>来表示,使标题字体变粗. <br />换行标记 <hr />水平分隔符 &nbsp空格符 &copy版权符 <a href>a标签超链接 href可接链接地址 <p>段落标签<blockquote>引用标签及可用做缩进 <table>表格中的<ul>无序列表<ol>有序列表<dl>自定义列表<row

浅谈二维中的树状数组与线段树

一般来说,树状数组可以实现的东西线段树均可胜任,实际应用中也是如此.但是在二维中,线段树的操作变得太过复杂,更新子矩阵时第一维的lazy标记更是麻烦到不行. 但是树状数组在某些询问中又无法胜任,如最值等不符合区间减法的询问.此时就需要根据线段树与树状数组的优缺点来选择了. 做一下基本操作的对比,如下图. 因为线段树为自上向下更新,从而可以使用lazy标记使得矩阵的更新变的高校起来,几个不足就是代码长,代码长和代码长. 对于将将矩阵内元素变为某个值,因为树状数组自下向上更新,且要满足区间加法等限制