3-3数据查询
tags:数据库
select 定义
SELECT [ ALL | DISTINCT [ ON ( expression [, ...] ) ] ]
* | expression [ AS output_name ] [, ...]
[ FROM from_item [, ...] ]
[ WHERE condition ]
[ GROUP BY expression [, ...] ]
[ HAVING condition [, ...] ]
[ { UNION | INTERSECT | EXCEPT } [ ALL ] select ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [, ...] ]
[ FOR UPDATE [ OF tablename [, ...] ] ]
[ LIMIT { count | ALL } ]
[ OFFSET start ]
select定义解释
from_item 可以是:
[ ONLY ] table_name [ * ]
[ [ AS ] alias [ ( column_alias_list ) ] ]
|
( select )
[ AS ] alias [ ( column_alias_list ) ]
|
from_item [ NATURAL ] join_type from_item
[ ON join_condition | USING ( join_column_list ) ]
expression
表的列/字段名或一个表达式.
output_name
使用 AS 子句为一个列/字段或一个表达式声明另一个名称. 这个名称主要用于标记输出列用于显示。 它可以在 ORDER BY 和 GROUP BY 子句里代表列/字段的值. 但是 output_name 不能用于 WHERE 或 HAVING 子句;用表达式代替.
from_item
一个表引用,子查询,或者 JOIN 子句.详见下文.
condition
一个布尔表达式,给出真或假的结果. 参见下面描述的 WHERE 和 HAVING 子句.
select
一个选择语句,可以有除 ORDER BY,FOR UPDATE,和 LIMIT 子句以外的所有 特性(甚至在加了括弧的情况下那些语句也可以用)
FROM 项可以包括:
table_name
一个现存的表或视图的名字.如果声明了 ONLY,则只扫描该表. 如果没有声明ONLY,该表和所有其派生表(如果有的话)都被扫描. 可以在表名后面跟一个 * 来表示扫所有其后代表, 但在目前的版本里,这是缺省特性. (在 PostgreSQL 7.1 以前的版本里, ONLY 是缺省特性.)
alias
用于于前面的 table_name. 的替换名字,用于缩写或消除一个表自连接时的含混. (此时同一个表要扫描好几次.) 如果写了别名,那么你也可以写一个字段别名列表,为表的一个或者几个 字段提供替换名字.
select
一个在 FORM 子句里出现的子查询.它的输出作用好象是为这条 SELECT 命令在其生存期里创建一个临时表. 请注意这个子查询必须用园括弧包围. 并且必须给它加别名.
join_type
[ INNER ] JOIN, LEFT [ OUTER ] JOIN, RIGHT [ OUTER ] JOIN, FULL [ OUTER ] JOIN,或 CROSS JOIN. 之一. 就 INNER 和 OUTER 连接类型,必须出现 NATURAL ON join_condition,或 USING ( join_column_list ) 之一.对于 CROSS JOIN,上面的项都不能出现.
join_condition
一个条件限制.类似 WHERE 条件,只不过它只应用于在这条 JOIN 子句里 连接的两个 from_item.
join_column_list
一个 USING 字段列表 (a, b, … ) 是 ON 条件 left_table.a = right_table.a AND left_table.b = right_table.b … 的缩写.
Rows
你声明的查询返回的所有结果集的行.
count
查询返回的行的计数.
描述
SELECT 将从一个或更多表中返回记录行。 选择的侯选行是满足 WHERE 条件的所有行。 或者如果省略了 WHERE 语句则选择表中的所有行.(参阅 WHERE 子句).
实际上,返回的行并不是由 FROM/WHERE/GROUP BY/HAVING 子句直接生成的行; 其实,输出行是通过给每个选出的行计算 SELECT 输出表达式形成的. 你可以在输出列表上写一个 * 表示选出的行的所有列. 同样我们可以拿 table_name.* 表示来自该表的所以行.
DISTINCT 将从选择出来的结果集中删除所有的重复的行。 ALL (缺省)将返回所有侯选行,包括重复的行。
DISTINCT ON 删除匹配所有你声明的表达式的行, 只保留每个重复集的第一行。 DISTINCT ON 表达式是用和 ORDER BY 项一样的规则来解释的,见下文. 注意这里每个重复集的”第一行”是不可预料的,除非我们用 ORDER BY 来保证我们希望的行最先出现。例如,
SELECT DISTINCT ON (location) location, time, report
FROM weatherReports
ORDER BY location, time DESC;
检索出每个地区的最近的天气预报。 但是如果我们没有使用 ORDER BY 来强制每个地区按时间值降续排列, 我们得到的将是每个地区的不可预料的时间的报告。
GROUP BY 子句允许用户把表分成匹配一个或多个数值的不同行的组. (参考 GROUP BY 子句.)
HAVING 允许只选择那些满足声明条件的行组(参阅 HAVING 子句.)
ORDER BY 导致返回的行按照声明的顺序排列. 如果没有给出 ORDER BY,输出的行的顺序将以系统认为开销最小的顺序产生. (参阅 ORDER BY 子句.)
多个 SELECT 查询可以用 UNION,INTERSECT,和 EXCEPT 操作符 组合起来.必要时请使用圆括弧确定这些操作符的顺序.
UNION 操作符计算是那些参与的查询所返回的行的集合。 如果没有声明 ALL,那么重复行被删除. (参阅 UNION 子句.)
INTERSECT 给出两个查询公共的行。 如果没有声明 ALL,那么重复行被删除. (参阅 INTERSECT 子句.)
EXCEPT 给出存在于第一个查询而不存在于第二个查询的行。 如果没有声明 ALL,那么重复行被删除. (参阅 EXCEPT 子句.)
FOR UPDATE 子句允许 SELECT 语句对选出的行执行排他锁。
LIMIT 子句允许给用户返回一个查询生成的结果的子集。(参阅 LIMIT 子句.)
你必须有 SELECT 权限用来从表中读取数值 (参阅 GRANT/REVOKE语句.)
各子句详解
from子句
FROM 子句为 SELECT 声明一个或多个源表. 如果声明了多个源表,则概念上结果是所有源表所有行的迪卡尔积 — 不过通常会增加限制条件以把返回的行限制为迪卡尔积的一个小子集.
如果 FROM 项是一个简单表名字,它隐含包括来自该表子表(继承子表)的行. ONLY 将消除从该表的子表来的行. 在 PostgreSQL 7.1 以前,这是缺省结果, 而获取子表的行是通过在表名后面附加 * 实现的. 这种老式性质可以通过命令 SET SQL_Inheritance TO OFF; 获取.
FROM 项也可以是一个加了圆括弧的子查询 (请注意子查询需要一个别名子句!). 这个特性非常实用,因为这是在一条查询中获得多层分组, 聚集,或者排序的唯一方法.
最后,FROM 项可以是一条 JOIN 子句,它把两个简单的 FROM 项组合 在一起.(必要时使用圆括弧来描述嵌套顺序.)
CROSS JOIN 或 INNER JOIN 是简单的迪卡尔积, 和你在顶层 FROM 里列出这两个项得到的一样. CROSS JOIN 等效于 INNER JOIN ON (TRUE),也就是说, 不会有任何行被条件删除.这些连接类型只是符号上的便利, 因为它们做得一点不比你只利用 FROM 和 WHERE 来的多.
LEFT OUTER JOIN 返回所有符合条件的迪卡尔积 (也就是说,所有符合它的 ON 条件的组合了的行),另外加上 所有没有右手边行符合 ON 条件的左手边表中的行. 这样的左手边行通过向右手边行插入 NULL 扩展为全长. 请注意,当判断哪些行合格的时候,只考虑 JOIN 自己的 ON 或 USING. 然后才考虑外层的 ON 或 WHERE 条件.
相反, RIGHT OUTER JOIN 返回所有连接的行, 另外加上所有未匹配右手边行(左手边插入 NULL 扩展为全长). 这个字句只是符号方便,因为你可以调换左右输入而改用 LEFT OUTER JOIN.
FULL OUTER JOIN 返回所有连接行,加上所有未匹配的左手边行 (右边插入 NULL 扩展为全长), 再加上所有未匹配的右手边行(左手边插入 NULL 扩展为全长).
除了CROSS JOIN 以外的所有 JOIN 类型,你必须写 ON join_condition, USING ( join_column_list ), 和 NATURAL 中的一个. 大多数情况下会是 ON:你可以写涉及两个连接表的任何条件表达式. USING 字段列表 (a, b, …) 是 ON 条件 left_table.a = right_table.a AND left_table.b = right_table.b … 的缩写. 另外,USING 假设两对等式中只有一个包含在 JOIN 输出中,而不是两个. NATURAL 是提及表中所有相似名字字段的 USING 列表的缩写.
where子句
可选的 WHERE 条件有如下常见的形式:
WHERE boolean_expr
boolean_expr 可以包含任意个得出布尔值的表达式。通常表达式会是
expr cond_op expr
或
log_op expr
这里 cond_op 可以是: =,<,<=, >,>= 或 <>, 或条件操作符象 ALL,ANY,IN,LIKE 等,或者用户定义的操作符,而 log_op 可以为 : AND,OR,NOT. SELECT 将忽略所有 WHERE 条件不为 TRUE 的行.
group by子句
GROUP BY 声明一个分了组的表,该表源于应用使用下面的子句:
GROUP BY expression [, …]
GROUP BY 将把所有在组合了的列上共享同样的值的行压缩成一行。 如果存在聚集函数,这些聚集函数将计算每个组的所有行,并且为 每个组计算一个独立的值(如果没有 GROUP BY, 聚集函数对选出的所有行计算出一个数值)。存在 GROUP BY 时,除了在聚集函数 里面,SELECT 输出表达式对任何非组合列的引用都是非法的, 因为对一个非组合列会有多于一个可能的返回值。
一个在 GROUP BY 里面的条目还可以是输出列的名称或者序号 (SELECT 表达式), 或者是一个从输入列的数值形成的任意表达式.当存在语义模糊时, 一个 GROUP BY 名称将被解释成一个输入列/字段名称而不是一个输出列/字段名称.
union子句
table_query UNION [ ALL ] table_query
[ ORDER BY expression [ ASC | DESC | USING operator ] [, …] ]
[ LIMIT { count | ALL } [ { OFFSET | , } start ]]
这里 table_query 表明任何没有 ORDER BY,FOR UPDATE,或者 LIMIT 子句的选择表达式. (如果用圆括弧包围,ORDER BY 和 LIMIT 可以放在子表达式里. 如果没有圆括弧,这些子句将交给 UNION 的结果使用, 而不是给它们右手边的输入表达式.)
UNION 操作符的结果集是那些涉及到的所有查询所返回结果的集合。 两个做为 UNION 直接操作数的 SELECT 必须生成相同数目的字段, 并且对应的字段必须有兼容的数据类型。
缺省地,UNION 的结果不包含任何重复的行,除非声明了 ALL 子句. ALL 制止了消除重复的动作.
同一 SELECT 语句中的多个 UNION 操作符是从左向右计算的, 除非用圆括弧进行了标识).
目前,FOR UPDATE 不能在 UNION 的结果或输入中声明.
intersect子句
table_query INTERSECT [ ALL ] table_query
[ ORDER BY expression [ ASC | DESC | USING operator ] [, …] ]
[ LIMIT { count | ALL } ]
[ OFFSET start ]
这里 table_query 声明任何没有 ORDER BY,FOR UPDATE,或者 LIMIT 子句的选择表达式。
INTERSECT 类似 UNION,只不过它给出在两个查询中都出现的行, 而不是两个查询的所有行.
INTERSECT 的结果不包含任何重复行,除非你声明了 ALL 选项. 用了 ALL 以后,一个在 L 里有 m 个重复而在 R 里有 n 个重复 的行将出现 min(m,n) 次.
除非用圆括号指明顺序, 同一 SELECT 语句中的多个 INTERSECT 操作符是从左向右计算的。 INTERSECT 比 UNION 绑定得更紧 — 也就是说 A UNION B INTERSECT C 将读做 A UNION (B INTERSECT C),除非你用圆括弧声明.
except子句
table_query EXCEPT [ ALL ] table_query
[ ORDER BY expression [ ASC | DESC | USING operator ] [, …] ]
[ LIMIT { count | ALL } ]
[ OFFSET start ]
这里 table_query 声明任何没有 ORDER BY,FOR UPDATE,或者 LIMIT 子句的选择表达式。
EXCEPT 类似于 UNION,只不过 EXCEPT 给出存在于左边查询输出而不存在于右边查询输出的行。
EXCEPT 的结果不包含任何重复的行,除非声明了 ALL 选项. 使用ALL时,一个在 L 中有 m 个重复而在 R 中有 n 个重复的行 将出现 max(m-n,0) 次.
除非用圆括弧指明顺序, 同一 SELECT 语句中的多个 EXCEPT 操作符是从左向右计算的。 EXCEPT 和 UNION 绑定级别相同.
limit子句
LIMIT { count | ALL }
OFFSET start
这里 count 声明返回的最大行数,而 start 声明开始返回行之前忽略的行数。
LIMIT 允许你检索由查询其他部分生成的行的某一部分。 如果给出了限制计数,那么返回的行数不会超过哪个限制。 如果给出了一个偏移量,那么开始返回行之前会忽略那个数量的行。
在使用 LIMIT 时, 一个好习惯是使用一个 ORDER BY 子句把结果行限制成一个唯一的顺序。 否则你会得到无法预料的查询返回的子集 — 你可能想要第十行到第二十行, 但以什么顺序?除非你声明 ORDER BY,否则你不知道什么顺序。
从 PostgreSQL 7.0 开始, 查询优化器在生成查询规划时把 LIMIT 考虑进去了, 所以你很有可能因给出的 LIMIT 和 OFFSET 值不同而得到不同的 规划(生成不同的行序)。 因此用不同的 LIMIT/OFFSET 值选择不同的查询结果的子集 将不会产生一致的结果, 除非你用 ORDER BY 强制生成一个可预计的结果顺序。 这可不是毛病;这是 SQL 生来的特点,因为除非用了 ORDER BYE 约束顺序, SQL 不保证查询生成的结果有任何特定的顺序。
exists子句和not exists语句
exists代表存在量词,带有exists谓词的子查询不返回任何数据,只产生逻辑真值true或者逻辑假值false 使用exists后,若内层查询结果非空,则外层的where 子句返回真值,否则返回假值
select sname
from student
where exists (select * from sc where sno = student.sno and cno = ‘1’)
执行过程:首先取外层查询中student表的第一个元组,根据它域内存查询的相关属性值处理内层查询,若where子句返回值为真,则取外层查询中该元组的sname放入结果表,然后再取student表的下一个元组,重复这一过程,直至外层stuent表全部查完为止.
内链接、左外连接、右外连接
内连接,inner join … on
>语句格式:
FROM (((表1 INNER JOIN 表2 ON 表1.字段号=表2.字段号) INNER JOIN 表3 ON 表1.字段号=表3.字段号) INNER JOIN 表4 ON Member.字段号=表4.字段号) INNER JOIN 表X
ON Member.字段号=表X.字段号
SELECT *
FROM (((Member INNER JOIN MemberSort ON Member.MemberSort=MemberSort.MemberSort) INNER JOIN MemberLevel ON Member.MemberLevel=MemberLevel.MemberLevel)
INNER JOIN MemberIdentity ON Member.MemberIdentity=MemberIdentity.MemberIdentity) INNER JOIN Wedlock ON Member.Wedlock=Wedlock.Wedlock
ORDER BY MemberDate DESC
内连接的功能是,把两个表相关联的记录列出来,必须是相关联的记录。
左外连接,left outer join … on
语句格式:
FROM [表名1] LEFT JOIN [表名2]
ON [表名1.字段A] 〈关系运算符〉[表名2.字段B]
其实LEFT JOIN 的功能就是将LEFT左边的表名1中的所有记录全部保留,而将右边的表名2中的字段B与表名1.字段A相对应的记录显示出来(当使用SELECT * 时)。而RIGHT JOIN
和LEFT JOIN 相反。
外连接的功能是,把LEFT左边的表中的所有记录保留,而右边表只保留相关联的记录,也就是先执行一次INNER JOIN,然后把LEFT左边的表中的与右边表没有任何关联的记录也
保留,而右边表的字段为null.
使用左向外联接
假设在 city 列上联接 authors 表和 publishers 表。结果只显示在出版商所在城市居住的作者(本例中为 Abraham Bennet 和 Cheryl Carson)。
若要在结果中包括所有的作者,而不管出版商是否住在同一个城市,请使用 SQL-92 左向外联接。下面是 Transact-SQL 左向外联接的查询和结果:
USE pubs
SELECT a.au_fname, a.au_lname, p.pub_name
FROM authors a LEFT OUTER JOIN publishers p
ON a.city = p.city
ORDER BY p.pub_name ASC, a.au_lname ASC, a.au_fname ASC
【也就是先把authors表中的所有数据列出,由于authors表中没有pub_name字段,所以为null 】
下面是结果集:
au_fname au_lname pub_name
Reginald Blotchet-Halls NULL
Michel DeFrance NULL
Innes del Castillo NULL
Ann Dull NULL
Marjorie Green NULL
Morningstar Greene NULL
Burt Gringlesby NULL
Sheryl Hunter NULL
Livia Karsen NULL
Charlene Locksley NULL
Stearns MacFeather NULL
Heather McBadden NULL
Michael O’Leary NULL
Sylvia Panteley NULL
Albert Ringer NULL
Anne Ringer NULL
Meander Smith NULL
Dean Straight NULL
Dirk Stringer NULL
Johnson White NULL
Akiko Yokomoto NULL
Abraham Bennet Algodata Infosystems
Cheryl Carson Algodata Infosystems
不管是否与 publishers 表中的 city 列匹配,LEFT OUTER JOIN 均会在结果中包含 authors 表的所有行。注意:结果中所列的大多数作者都没有相匹配的数据,因此,这些行的
pub_name 列包含空值。
右外连接,right outer join … on
与 left join左右相反。
假设在 city 列上联接 authors 表和 publishers 表。结果只显示在出版商所在城市居住的作者(本例中为 Abraham Bennet 和 Cheryl Carson)。SQL-92 右向外联接运算符
RIGHT OUTER JOIN 指明:不管第一个表中是否有匹配的数据,结果将包含第二个表中的所有行。
若要在结果中包括所有的出版商,而不管城市中是否还有出版商居住,请使用 SQL-92 右向外联接。下面是 Transact-SQL 右向外联接的查询和结果:
USE pubs
SELECT a.au_fname, a.au_lname, p.pub_name
FROM authors AS a RIGHT OUTER JOIN publishers AS p
ON a.city = p.city
ORDER BY p.pub_name ASC, a.au_lname ASC, a.au_fname ASC
下面是结果集:
au_fname au_lname pub_name
Abraham Bennet Algodata Infosystems
Cheryl Carson Algodata Infosystems
NULL NULL Binnet & Hardley
NULL NULL Five Lakes Publishing
NULL NULL GGG&G
NULL NULL Lucerne Publishing
NULL NULL New Moon Books
NULL NULL Ramona Publishers
NULL NULL Scootney Books
使用谓词(如将联接与常量比较)可以进一步限制外联接。下例包含相同的右向外联接,但消除销售量低于 50 本的书籍的书名:
USE pubs
SELECT s.stor_id, s.qty, t.title
FROM sales s RIGHT OUTER JOIN titles t
ON s.title_id = t.title_id
AND s.qty > 50
ORDER BY s.stor_id ASC
全连接,full join … on(不常使用,只能用于outer)
功能结合了以上三种联军,先执行一次inner join,然后把两个表的多余字段都保留,但连接的对应字段为null.
如果想将几个表联接起来,在JOIN操作中我们可以进行嵌套操作,有三个表:表1、表2、表3,现在将三个表联接起来:
FROM (表1 INNER JOIN 表2 ON 表1.序号=表2.序号) INNER JOIN 表3 ON 表1.序号=表3.序号
使用完整外部联接
若要通过在联接结果中包括不匹配的行保留不匹配信息,请使用完整外部联接。Microsoft? SQL Server? 2000 提供完整外部联接运算符 FULL OUTER JOIN,不管另一个表是否有
匹配的值,此运算符都包括两个表中的所有行。
假设在 city 列上联接 authors 表和 publishers 表。结果只显示在出版商所在城市居住的作者(本例中为 Abraham Bennet 和 Cheryl Carson)。SQL-92 FULL OUTER JOIN 运
算符指明:不管表中是否有匹配的数据,结果将包括两个表中的所有行。
若要在结果中包括所有作者和出版商,而不管城市中是否有出版商或者出版商是否住在同一个城市,请使用完整外部联接。下面是 Transact-SQL 完整外部联接的查询和结果:
USE pubs
SELECT a.au_fname, a.au_lname, p.pub_name
FROM authors a FULL OUTER JOIN publishers p
ON a.city = p.city
ORDER BY p.pub_name ASC, a.au_lname ASC, a.au_fname ASC
下面是结果集:
au_fname au_lname pub_name
Reginald Blotchet-Halls NULL
Michel DeFrance NULL
Innes del Castillo NULL
Ann Dull NULL
Marjorie Green NULL
Morningstar Greene NULL
Burt Gringlesby NULL
Sheryl Hunter NULL
Livia Karsen NULL
Charlene Locksley NULL
Stearns MacFeather NULL
Heather McBadden NULL
Michael O’Leary NULL
Sylvia Panteley NULL
Albert Ringer NULL
Anne Ringer NULL
Meander Smith NULL
Dean Straight NULL
Dirk Stringer NULL
Johnson White NULL
Akiko Yokomoto NULL
Abraham Bennet Algodata Infosystems
Cheryl Carson Algodata Infosystems
NULL NULL Binnet & Hardley
NULL NULL Five Lakes Publishing
NULL NULL GGG&G
NULL NULL Lucerne Publishing
NULL NULL New Moon Books
NULL NULL Ramona Publishers
NULL NULL Scootney Books
嵌套查询
在sql语言中,一个select-from-where语句成为一个查询块.讲一个查询块嵌在另一个查询块的where子句或者having短语的条件中的查询成为嵌套查询
select sname
from student
where sno in (select sno from scc where cno = ‘2’);
本例中,下层查询块select sono from sc where sc where cno = ‘2’ 是嵌套在上层查询的条件中的.上层查询块称为外层查询或者父查询,下层查询块成为内查询或者子查询.
有些嵌套查询可以用连接运算替代,有些是不能替代的.目前商用关系数据库的管理系统对嵌套查询的优化做的还不够完善.所以在实际应用中,能够用连接运算表达的查询尽可能采用连接查询.
不相关子查询
子查询的查询条件不依赖于父查询,成为不相关子查询.
select sno , sname ,sdept
from student
where sdept in (select sdept from student where sname = ‘刘晨’)
相关子查询
子查询中的查询条件依赖于父查询,这类子查询称为相关子查询.整个语句成为相关嵌套查询语句.
select sno , cno
from sc x
where grade >= (select avg(grade) from sc y where y.sno = x.sno)
x是表sc的别名,又称为元组变量,可以用来表示sc的一个元组.内层查询是求一个学生所有选修课程平均成绩的,至于是哪个学生的平均成绩则要看参数x.sno的值,而该值是域父查询相关的,因此这类查询成为相关子查询.