SELECT
是用来做什么的呢?一个最常用的方式是将资料从数据库中的表格内选出。从这一句回答中,我们马上可以看到两个关键字:从 (FROM)数据库中的表格内选出 (SELECT)。(表格是一个数据库内的结构,它的目的是储存资料。在表格处理这一部分中,我们会提到如何使用 SQL 来设定表格。) 我们由这里可以看到最基本的 SQL 架构:
SELECT "栏位名"FROM "表格名"
我们用以下的例子来看看实际上是怎么用的。假设我们有以下这个表格:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若要选出所有的店名(store_Name),我们就打入:
SELECT store_name FROM Store_Information
结果:
store_name |
Los Angeles |
San Diego |
Los Angeles |
Boston |
我们一次可以读取好几个栏位,也可以同时由好几个表格中选资料。
简单的SQL查询只包括选择列表、FROM子句和WHERE子句。它们分别说明所查询列、查询的表或视图、以及搜索条件等。
1、选择所有列
例如,下面语句显示testtable表中所有列的数据:
代码:SELECT *
FROMtesttable
2、选择部分列并指定它们的显示次序查询结果集合中数据的排列顺序与选择列表中所指定的列名排列顺序相同。例如:
代码:SELECT nickname,email
FROMtesttable
3、更改列标题
在选择列表中,可重新指定列标题。定义格式为:列标题=列名
如果指定的列标题不是标准的标识符格式时,应使用引号定界符,例如,下列语句使用汉字显示列标题:
代码:SELECT 昵称=nickname,电子邮件=email FROM testtable
4、删除重复行
SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件的所有行或删除其中重复的数据行,默认为ALL。使用DISTINCT选项时,对于所有重复的数据行在SELECT返回的结果集合中只保留一行。
5、限制返回的行数
使用TOP n [PERCENT]选项限制返回的数据行数,TOP n说明返回n行,而TOP n
PERCENT时,说明n是表示一百分数,指定返回的行数等于总行数的百分之几。例如:
代码:SELECT TOP 2 *
FROM `testtable`
代码:SELECT TOP 20 PERCENT*
FROM `testtable`
DISTINCT
SELECT 指令让我们能够读取表格中一个或数个栏位的所有资料。这将把所有的资料都抓出,无论资料值有无重复。在资料处理中,我们会经常碰到需要找出表格内的不同资料值的情况。换句话说,我们需要知道这个表格/栏位内有哪些不同的值,而每个值出现的次数并不重要。这要如何达成呢?在 SQL 中,这是很容易做到的。我们只要在
SELECT 后加上一个 DISTINCT 就可以了。DISTINCT 的语法如下:
SELECT DISTINCT"栏位名"
FROM "表格名"
举例来说,若要在以下的表格,Store_Information,找出所有不同的店名时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT DISTINCT store_name
FROM Store_Information
结果:
store_name
Los Angeles
San Diego
Boston
WHERE
我们并不一定每一次都要将表格内的资料都完全抓出。在许多时候,我们会需要选择性地抓资料。就我们的例子来说,我们可能只要抓出营业额超过 $1,000 的资料。要做到这一点,我们就需要用到
WHERE 这个指令。这个指令的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "条件"
比较运算符(大小比较):>、>=、=、<、<=、!<、!>、!=
例:返回96年1月的定单
SELECT orderID, CustomerID, orderDate
FROM orders
WHERE orderDate〉#1/1/96#AND orderDate〈#1/30/96#
注意:
Mcirosoft JET SQL 中,日期用‘#’定界。日期也可以用Datevalue()函数来代替。在比较字符型的数据时,要加上单引号’’,尾空格在比较中被忽略。
例:
WHERE orderDate〉#96-1-1#
也可以表示为:
WHERE orderDate〉Datevalue(‘1/1/96’)
若我们要由以下的表格抓出营业额超过 $1,000 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
结果:
store_name
Los Angeles
ANDOR
在上一页中,我们看到 WHERE 指令可以被用来由表格中有条件地选取资料。 这个条件可能是简单的 (像上一页的例子),也可能是复杂的。复杂条件是由二或多个简单条件透过
AND 或是 OR的连接而成。一个 SQL 语句中可以有无限多个简单条件的存在。
复杂条件的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "简单条件"
{[AND|OR] "简单条件"}+
{}+ 代表{}之内的情况会发生一或多次。在这里的意思就是 AND 加简单条件及
OR 加简单条件的情况可以发生一或多次。另外,我们可以用 () 来代表条件的先后次序。
举例来说,我们若要在 Store_Information 表格中选出所有 Sales 高于 $1,000或是 Sales 在 $500 及 $275 之间的资料的话,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
OR (Sales < 500
ANDSales > 275)
结果:
store_name
Los Angeles
San Francisco
IN
在 SQL 中,在两个情况下会用到IN 这个指令;这一页将介绍其中之一:与 WHERE 有关的那一个情况。在这个用法下,我们事先已知道至少一个我们需要的值,而我们将这些知道的值都放入 IN 这个子句。 IN 指令的语法为下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"IN (‘值一‘, ‘值二‘, ...)
在括号内可以有一或多个值,而不同值之间由逗点分开。值可以是数目或是文字。若在括号内只有一个值,那这个子句就等于
WHERE "栏位名"= ‘值一‘
举例来说,若我们要在 Store_Information 表格中找出所有含盖 Los Angeles 或 SanDiego 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE store_name IN (‘Los Angeles‘, ‘San Diego‘)
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
BETWEEN
IN 这个指令可以让我们依照一或数个不连续 (discrete) 的值的限制之内抓出资料库中的值,而 BETWEEN 则是让我们可以运用一个范围 (range) 内抓出资料库中的值。BETWEEN这个子句的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"BETWEEN ‘值一‘
AND ‘值二‘
这将选出栏位值包含在值一及值二之间的每一笔资料。
举例来说,若我们要由 Store_Information 表格中找出所有介于 January 6, 1999 及 January10, 1999 中的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE Date BETWEEN ‘Jan-06-1999‘
AND‘Jan-10-1999‘
请读者注意:在不同的数据库中,日期的储存法可能会有所不同。在这里我们选择了其中一种储存法。
结果:
store_name |
Sales |
Date |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
LIKE
LIKE 是另一个在 WHERE 子句中会用到的指令。基本上, LIKE 能让我们依据一个模式 (pattern) 来找出我们要的资料。相对来说,在运用 IN 的时候,我们完全地知道我们需要的条件;在运用 BETWEEN 的时候,我们则是列出一个范围。 LIKE 的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"LIKE {模式}
LIKE运算符里使用的通配符
通配符含义
?任何一个单一的字符
* 任意长度的字符
# 0~9之间的单一数字
[字符列表]在字符列表里的任一值
[!字符列表] 不在字符列表里的任一值
- 指定字符范围,两边的值分别为其上下限
{模式} 经常包括野卡 (wildcard). 以下是几个例子:
‘A_Z‘: 所有以 ‘A‘ 起头,另一个任何值的字原,且以 ‘Z‘ 为结尾的字符串。‘ABZ‘ 和 ‘A2Z‘ 都符合这一个模式,而‘AKKZ‘ 并不符合 (因为在 A 和 Z 之间有两个字原,而不是一个字原)。
‘ABC%‘: 所有以 ‘ABC‘ 起头的字符串。举例来说,‘ABCD‘ 和‘ABCABC‘ 都符合这个模式。
‘%XYZ‘: 所有以 ‘XYZ‘ 结尾的字符串。举例来说,‘WXYZ‘ 和 ‘ZZXYZ‘都符合这个模式。
‘%AN%‘: 所有含有 ‘AN‘这个模式的字符串。举例来说, ‘LOS ANGELES‘ 和 ‘SANFRANCISCO‘ 都符合这个模式。
我们将以上最后一个例子用在我们的 Store_Information 表格上:
Store_Information 表格
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
BOSTON |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE store_name LIKE ‘%AN%‘
结果:
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
ODERBY
到目前为止,我们已学到如何藉由 SELECT 及
WHERE 这两个指令将资料由表格中抓出。不过我们尚未提到这些资料要如何排列。这其实是一个很重要的问题。事实上,我们经常需要能够将抓出的资料做一个有系统的显示。这可能是由小往大 (ASCENDing) 或是由大往小(DESCENDing)。在这种情况下,我们就可以运用
ODER BY 这个指令来达到我们的目的。
ODER BY 的语法如下:
SELECT "栏位名"
FROM "表格名"
[WHERE "条件"]
ODER BY "栏位名"[ASC,
DESC]
[] 代表 WHERE 子句不是一定需要的。不过,如果
WHERE 子句存在的话,它是在ODER BY 子句之前。
ASC 代表结果会以由小往大的顺序列出,而 DESC 代表结果会以由大往小的顺序列出。如果两者皆没有被写出的话,那我们就会用
ASC。
我们可以照好几个不同的栏位来排顺序。在这个情况下, ODER BY 子句的语法如下(假设有两个栏位):
ODER BY "栏位一"[ASC,
DESC],"栏位二" [ASC,
DESC]
若我们对这两个栏位都选择由小往大的话,那这个子句就会造成结果是依据 "栏位一"由小往大排。若有好几笔资料 "栏位一"的值相等,那这几笔资料就依据 "栏位二"由小往大排。
举例来说,若我们要依照 Sales 栏位的由大往小列出Store_Information 表格中的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
an-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY Sales DESC
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
Boston |
$700 |
Jan-08-1999 |
San Francisco |
$300 |
Jan-08-1999 |
San Diego |
$250 |
Jan-07-1999 |
在以上的例子中,我们用栏位名来指定排列顺序的依据。除了栏位名外,我们也可以用栏位的顺序 (依据 SQL 句中的顺序)。在
SELECT 后的第一个栏位为 1,第二个栏位为 2,以此类推。在上面这个例子中,我们用以下这句 SQL 可以达到完全一样的效果:
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY 2 DESC
函数
既然数据库中有许多资料都是已数字的型态存在,一个很重要的用途就是要能够对这些数字做一些运算,例如将它们总合起来,或是找出它们的平均值。SQL 有提供一些这一类的函数。它们是:
AVG (平均)
COUNT (计数)
MAX (最大值)
MIN (最小值)
SUM (总合)
VAR (方差)
STDEV (标准误差)
FIRST (第一个值)
LAST (最后一个值)
运用函数的语法是:
SELECT "函数名"("栏位名")
FROM "表格名"
举例来说,若我们要由我们的范例表格中求出 Sales 栏位的总合,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT SUM(Sales) FROM Store_Information
结果:
SUM(Sales)
$2750
$2750 代表所有 Sales 栏位的总合: $1500 + $250 + $300 + $700.
除了函数的运用外,SQL 也可以做简单的数学运算,例如加(+)和减(-)。对于文字类的资料,SQL也有好几个文字处理方面的函数,例如文字相连 (concatenation),文字修整(trim),以及子字符串 (substring)。不同的数据库对这些函数有不同的语法,所以最好是参考您所用数据库的信息,来确定在那个数据库中,这些函数是如何被运用的。
COUNT
在上一页有提到, COUNT 是函数之一。由于它的使用广泛,我们在这里特别提出来讨论。基本上, COUNT 让我们能够数出在表格中有多少笔资料被选出来。它的语法是:
SELECT COUNT("栏位名")
FROM "表格名"
举例来说,若我们要找出我们的范例表格中有几笔 store_name 栏不是空白的资料时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT COUNT(store_name)
FROM Store_Information
WHERE store_name is not NULL
结果:
Count(store_name)
4
"is not NULL" 是 "这个栏位不是空白"的意思。
COUNT 和 DISTINCT 经常被合起来使用,目的是找出表格中有多少笔不同的资料 (至于这些资料实际上是什么并不重要)。举例来说,如果我们要找出我们的表格中有多少个不同的 store_name,我们就键入,
SELECT COUNT(DISTINCT store_name)
FROM Store_Information
结果:
Count(DISTINCTstore_name)
3
GROUP BY
我们现在回到函数上。记得我们用 SUM 这个指令来算出所有的 Sales (营业额)吧!如果我们的需求变成是要算出每一间店 (store_name) 的营业额 (sales),那怎么办呢?在这个情况下,我们要做到两件事:第一,我们对于 store_name 及 Sales 这两个栏位都要选出。第二,我们需要确认所有的 sales 都要依照各个store_name 来分开算。这个语法为:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
在我们的范例上,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, SUM(Sales)
FROM Store_Information
GROUP BY store_name
结果:
store_name SUM(Sales)
Los Angeles $1800
San Diego $250
Boston $700
当我们选不只一个栏位,且其中至少一个栏位有包含函数的运用时,我们就需要用到 GROUP BY 这个指令。在这个情况下,我们需要确定我们有
GROUP BY 所有其他的栏位。换句话说,除了有包括函数的栏位外,我们都需要将其放在
GROUP BY 的子句中。
HAVING
那我们如何对函数产生的值来设定条件呢?举例来说,我们可能只需要知道哪些店的营业额有超过 $1,500。在这个情况下,我们不能使用
WHERE 的指令。那要怎么办呢?很幸运地,SQL 有提供一个 HAVING 的指令,而我们就可以用这个指令来达到这个目标。
HAVING 子句通常是在一个 SQL 句子的最后。一个含有HAVING 子句的 SQL 并不一定要包含
GROUP BY 子句。HAVING 的语法如下:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件)
请读者注意: 如果被 SELECT 的只有函数栏, 那就不需要
GROUP BY 子句。
在我们 Store_Information 表格这个例子中,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若我们要找出 Sales 大于 $1,500的 store_name,我们就键入,
SELECT store_name, SUM(sales)
FROM Store_Information
GROUP BY store_name
HAVING SUM(sales) > 1500
结果:
store_name SUM(Sales)
Los Angeles $1800
ALIAS
接下来,我们讨论 alias (别名) 在 SQL 上的用处。最常用到的别名有两种:栏位别名及表格别名。
简单地来说,栏位别名的目的是为了让 SQL 产生的结果易读。在之前的例子中,每当我们有营业额总合时,栏位名都是 SUM(sales)。虽然在这个情况下没有什么问题,可是如果这个栏位不是一个简单的总合,而是一个复杂的计算,那栏位名就没有这么易懂了。若我们用栏位别名的话,就可以确认结果中的栏位名是简单易懂的。
第二种别名是表格别名。要给一个表格取一个别名,只要在 FROM 子句中的表格名后空一格,然后再列出要用的表格别名就可以了。这在我们要用 SQL 由数个不同的表格中获取资料时是很方便的。这一点我们在之后谈到连接 (join) 时会看到。
我们先来看一下栏位别名和表格别名的语法:
SELECT "表格别名"."栏位1" "栏位别名"
FROM "表格名""表格别名"
或者:
SELECT "表格名"AS "表格别名"
基本上,这两种别名都是放在它们要替代的物件后面,而它们中间由一个空白分开。我们继续使用 Store_Information 这个表格来做例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们用跟 SQL GROUP BY 那一页一样的例子。这里的不同处是我们加上了栏位别名以及表格别名:
SELECT A1.store_name Store, SUM(A1.Sales) "Total Sales"
FROM Store_Information A1
GROUP BY A1.store_name
结果:
Store Total Sales
Los Angeles $1800
San Diego $250
Boston $700
在结果中,资料本身没有不同。不同的是栏位的标题。这是运用栏位别名的结果。在第二个栏位上,原本我们的标题是 "Sum(Sales)",而现在我们有一个很清楚的 "Total Sales"。很明显地, "Total Sales" 能够比 "Sum(Sales)" 更精确地阐述这个栏位的含意。用表格别名的好处在这里并没有显现出来,不过这在 下一页就会很清楚了。
表格链接
现在我们介绍连接(join)的概念。要了解连接,我们需要用到许多我们之前已介绍过的指令。我们先假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们要知道每一区 (region_name) 的营业额(sales)。 Geography 这个表格告诉我们每一区有哪些店,而 Store_Information 告诉我们每一个店的营业额。若我们要知道每一区的营业额,我们需要将这两个不同表格中的资料串联起来。当我们仔细了解这两个表格后,我们会发现它们可经由一个相同的栏位,store_name,连接起来。我们先将SQL 句列出,之后再讨论每一个子句的意义:
SELECT A1.region_name REGION, SUM(A2.Sales) SALES
FROM Geography A1, Store_Information A2
WHERE A1.store_name = A2.store_name
GROUP BY A1.region_name
结果:
REGION SALES
East $700
West $2050
在第一行中,我们告诉 SQL 去选出两个栏位:第一个栏位是Geography 表格中的 region_name 栏位 (我们取了一个别名叫做 REGION);第二个栏位是 Store_Information 表格中的 sales 栏位 (别名为 SALES)。请注意在这里我们有用到表格别名:Geography 表格的别名是 A1,Store_Information 表格的别名是 A2。若我们没有用表格别名的话,第一行就会变成
SELECT Geography.region_name REGION, SUM(Store_Information.Sales) SALES
很明显地,这就复杂多了。在这里我们可以看到表格别名的功用:它能让 SQL 句容易被了解,尤其是这个 SQL 句含盖好几个不同的表格时。
接下来我们看第三行,就是 WHERE 子句。这是我们阐述连接条件的地方。在这里,我们要确认 Geography 表格中store_name 栏位的值与 Store_Information 表格中 store_name 栏位的值是相等的。这个
WHERE 子句是一个连接的灵魂人物,因为它的角色是确定两个表格之间的连接是正确的。如果
WHERE 子句是错误的,我们就极可能得到一个笛卡儿连接 (Cartesian join)。笛卡儿连接会造成我们得到所有两个表格每两行之间所有可能的组合。在这个例子中,笛卡儿连接会让我们得到 4 x 4 = 16 行的结果。
外部链接
之前我们看到的左连接 (left join),又称内部连接(inner join)。在这个情况下,要两个表格内都有同样的值,那一笔资料才会被选出。那如果我们想要列出一个表格中每一笔的资料,无论它的值在另一个表格中有没有出现,那该怎么办呢?在这个时候,我们就需要用到 SQL OUTER JOIN (外部连接) 的指令。
外部连接的语法是依数据库的不同而有所不同的。举例来说,在 Oracle 上,我们会在 WHERE 子句中要选出所有资料的那个表格之后加上一个"(+)" 来代表说这个表格中的所有资料我们都要。
假设我们有以下的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们需要知道每一间店的营业额。如果我们用一个普通的连接,我们将会漏失掉 ‘New York‘这个店,因为它并不存在于 Store_Information 这个表格。所以,在这个情况下,我们需要用外部连接来串联这两个表格:
SELECT A1.store_name, SUM(A2.Sales) SALES
FROM Georgraphy A1, Store_Information A2
WHERE A1.store_name = A2.store_name (+)
GROUP BY A1.store_name
我们在这里是使用了 Oracle 的外部连接语法。
结果:
store_name SALES
Boston $700
New York
Los Angeles $1800
San Diego $250
请注意: 当第二个表格没有相对的资料时, SQL 会传回 NULL 值。在这一个例子中, ‘New York‘ 并不存在于Store_Information 表格,所以它的 "SALES" 栏位是 NULL.
CONCATENATE
有的时候,我们有需要将由不同栏位获得的资料串连在一起。每一种数据库都有提供方法来达到这个目的:
MySQL: CONCAT()
Oracle: CONCAT(), ||
SQL Server: +
CONCAT() 的语法如下:
CONCAT(字符串1, 字符串2, 字符串3, ...): 将字符串1、字符串2、字符串3,等字符串连在一起。请注意,Oracle的CONCAT()只允许两个参数;换言之,一次只能将两个字符串串连起来。不过,在Oracle中,我们可以用‘||‘来一次串连多个字符串。
来看一个例子。假设我们有以下的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
例子1:
MySQL/Oracle:
SELECT CONCAT(region_name,store_name)
FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘EastBoston‘
例子2:
Oracle:
SELECT region_name || ‘ ‘ || store_name
FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘East Boston‘
例子3:
SQL Server:
SELECT region_name + ‘ ‘ + store_name
FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘East Boston‘
SUBSTRING
SQL 中的 substring 函数是用来抓出一个栏位资料中的其中一部分。这个函数的名称在不同的数据库中不完全一样:
MySQL: SUBSTR(), SUBSTRING()
Oracle: SUBSTR()
SQL Server: SUBSTRING()
最常用到的方式如下 (在这里我们用SUBSTR()为例):
SUBSTR(str,pos): 由<str>中,选出所有从第<pos>位置开始的字符。请注意,这个语法不适用于SQL Server上。
SUBSTR(str,pos,len): 由<str>中的第<pos>位置开始,选出接下去的<len>个字符。
假设我们有以下的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
例1:
SELECT SUBSTR(store_name, 3)
FROM Geography
WHERE store_name = ‘Los Angeles‘;
结果:
‘s Angeles‘
例2:
SELECT SUBSTR(store_name,2,4)
FROM Geography
WHERE store_name = ‘San Diego‘;
结果:
‘an D‘
进阶SQL
在这一部分,我们将介绍以下的 SQL 概念及关键字:
我们并介绍如何用 SQL 来做出以下的运算:
累积总合百分比 (Cumulative Percent to Total)
UNION
UNION 指令的目的是将两个 SQL 语句的结果合并起来。从这个角度来看,
UNION 跟 JOIN 有些许类似,因为这两个指令都可以由多个表格中撷取资料。 UNION 的一个限制是两个 SQL 语句所产生的栏位需要是同样的资料种类。另外,当我们用
UNION 这个指令时,我们只会看到不同的资料值 (类似
SELECT DISTINCT)。
UNION 的语法如下:
[SQL 语句 1]
UNION
[SQL 语句 2]
假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出来所有有营业额 (sales) 的日子。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
UNION
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
有一点值得注意的是,如果我们在任何一个 SQL 语句 (或是两句都一起) 用 "SELECT
DISTINCTDate" 的话,那我们会得到完全一样的结果。
UNION ALL
UNION ALL 这个指令的目的也是要将两个 SQL 语句的结果合并在一起。UNION ALL 和
UNION 不同之处在于 UNION ALL 会将每一笔符合条件的资料都列出来,无论资料值有无重复。
UNION ALL 的语法如下:
[SQL 语句 1]
UNION ALL
[SQL 语句 2]
我们用和上一页同样的例子来显示出UNION ALL 和
UNION 的不同。同样假设我们有以下两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出有店面营业额以及网络营业额的日子。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
UNION ALL
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-08-1999
Jan-07-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
INTERSECT
和 UNION 指令类似,INTERSECT 也是对两个 SQL 语句所产生的结果做处理的。不同的地方是,
UNION 基本上是一个 OR (如果这个值存在于第一句或是第二句,它就会被选出),而
INTERSECT则比较像 AND (这个值要存在于第一句和第二句才会被选出)。
UNION是联集,而 INTERSECT 是交集。
INTERSECT 的语法如下:
[SQL 语句 1]
INTERSECT
[SQL 语句 2]
假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出哪几天有店面交易和网络交易。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
INTERSECT
SELECT Date FROM Internet_Sales
结果:
Date
Jan-07-1999
请注意,在 INTERSECT 指令下,不同的值只会被列出一次。
MINUS
MINUS 指令是运用在两个 SQL 语句上。它先找出第一个SQL 语句所产生的结果,然后看这些结果有没有在第二个 SQL 语句的结果中。如果有的话,那这一笔资料就被去除,而不会在最后的结果中出现。如果第二个 SQL 语句所产生的结果并没有存在于第一个 SQL 语句所产生的结果内,那这笔资料就被抛弃。
MINUS 的语法如下:
[SQL 语句 1]
MINUS
[SQL 语句 2]
我们继续使用一样的例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要知道有哪几天是有店面营业额而没有网络营业额的。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
MINUS
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-08-1999
"Jan-05-1999","Jan-07-1999", AND"Jan-08-1999" 是 "SELECTDate
FROM Store_Information" 所产生的结果。在这里面, "Jan-07-1999" 是存在于 "SELECT Date
FROMInternet_Sales" 所产生的结果中。因此"Jan-07-1999" 并不在最后的结果中。
请注意,在 MINUS 指令下,不同的值只会被列出一次。
子查询
我们可以在一个 SQL 语句中放入另一个SQL 语句。当我们在 WHERE 子句或
HAVING 子句中插入另一个SQL 语句时,我们就有一个子查询 (subquery) 的架构。 子查询的作用是什么呢?第一,它可以被用来连接表格。另外,有的时候子查询是唯一能够连接两个表格的方式。
子查询的语法如下:
SELECT "栏位1"
FROM "表格"
WHERE "栏位2"[比较运算素]
(SELECT "栏位1"
FROM "表格"
WHERE [条件])
[比较运算素] 可以是相等的运算素,例如 =, >, <, >=, <=. 这也可以是一个对文字的运算素,例如 "LIKE"。绿色的部分代表外查询,红色的部分代表内查询。
我们就用刚刚在阐述 SQL 连接时用过的例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们要运用 subquery 来找出所有在西部的店的营业额。我们可以用下面的 SQL 来达到我们的目的:
SELECT SUM(Sales) FROM Store_Information
WHERE Store_name IN
(SELECTstore_name FROM Geography
WHERE region_name = ‘West‘)
结果:
SUM(Sales)
2050
在这个例子中,我们并没有直接将两个表格连接起来,然后由此直接算出每一间西区店面的营业额。我们做的是先找出哪些店是在西区的,然后再算出这些店的营业额总共是多少。
在以上的例子,内部查询本身与外部查询没有关系。这一类的子查询称为『简单子查询』 (Simple Subquery)。如果内部查询是要利用到外部查询提到的表格中的栏位,那这个字查询就被称为『相关子查询』 (Correlated Subquery)。以下是一个相关子查询的例子:
SELECT SUM(a1.Sales)
FROMStore_Information a1
WHERE a1.Store_name IN
(SELECTstore_name FROM Geography a2
WHERE a2.store_name =
a1.store_name)
红色部分即是外部查询提到的表格中的栏位。
EXISTS
在上一页中,我们用 IN 来连接内查询和外查询。另外有数个方式,例如 >, <, 及 =,都可以用来连接内查询和外查询。 EXISTS 也是其中一种方式。这一页我们将讨论 EXISTS 的用法。
基本上, EXISTS 是用来测试内查询有没有产生任何结果。如果有的话,系统就会执行外查询中的 SQL。若是没有的话,那整个SQL 语句就不会产生任何结果。
EXISTS 的语法是:
SELECT "栏位1"
FROM "表格1"
WHERE EXISTS
(SELECT *
FROM "表格2"
WHERE [条件])
在内查询中,我们并不一定要用 * 来选出所有的栏位。我们也可以选择表格2中的任何栏位。这两种做法最后的结果是一样的。
来看一个例子。假设我们有以下的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们打入的 SQL 是:
SELECT SUM(Sales) FROM Store_Information
WHERE EXISTS
(SELECT * FROM Geography
WHERE region_name = ‘West‘)
我们会得到以下的答案:
SUM(Sales)
2750
乍看之下,这个答案似乎不太正确,因为内查询有包含一个 [region_name = ‘West‘] 的条件,可是最后的答案并没有包含这个条件。实际上,这并没有问题。在这个例子中,内查询产生了超过一笔的资料,所以 EXISTS 的条件成立,所以外查询被执行。而外查询本身并没有包含 [region_name = ‘West‘] 这个条件。
CASE
CASE 是 SQL 用来做为 IF-THEN-ELSE 之类逻辑的关键字。
CASE 的语法如下:
SELECT CASE ("栏位名")
WHEN "条件1" THEN "结果1"
WHEN "条件2" THEN "结果2"
...
[ELSE "结果N"]
END
FROM "表格名"
"条件" 可以是一个数值或是公式。 ELSE 子句则并不是必须的。
在我们的 Store_Information 中
Store_Information 表格
store_name Sales Date
Los Angeles $1500 Jan-05-1999
San Diego $250 Jan-07-1999
San Francisco $300 Jan-08-1999
Boston $700 Jan-08-1999
若我们要将 ‘Los Angeles‘ 的 Sales 数值乘以2,以及将 ‘San Diego‘ 的 Sales 数值乘以1.5,我们就键入以下的 SQL:
SELECT store_name, CASE store_name
WHEN ‘Los Angeles‘
THENSales * 2
WHEN ‘San Diego‘ THENSales * 1.5
ELSE Sales
END
"New Sales",
Date
FROM Store_Information
"New Sales" 是用到 CASE 那个栏位的栏位名。
结果:
store_name |
New Sales |
Date |
Los Angeles |
$3000 |
Jan-05-1999 |
San Diego |
$375 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
算排名
列出每一行的排名是一个常见的需求,可惜 SQL 并没有一个很直接的方式达到这个需求。要以 SQL 列出排名,基本的概念是要做一个表格自我连结 (self join),将结果依序列出,然后算出每一行之前 (包含那一行本身) 有多少行数。这样讲读者听得可能有点困惑,所以最好的方式是用一个实例来介绍。假设我们有以下的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要找出每一行的排名,我们就打入以下的 SQL 语句:
SELECT a1.Name, a1.Sales, COUNT(a2.sales) Sales_Rank
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.Sales
OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name
DESC;
结果:
Name Sales Sales_Rank
Greg 50 1
Sophia 40 2
Stella 20 3
Jeff 20 3
Jennifer 15 5
John 10 6
我们先来看 WHERE 子句。在字句的第一部分(a1.Sales <= a2.Sales),我们算出有多少笔资料Sales 栏位的值是比自己本身的值小或是相等。如果在 Sales 栏位中没有同样大小的资料,那这部分的
WHERE 子句本身就可以产生出正确的排名。
子句的第二部分,(a1.Sales=a2.Sales ANDa1.Name = a2.Name),则是让我们在 Sales 栏位中有同样大小的资料时 (像 Stella 及 Jeff 这两笔资料),仍然能够产生正确的排名。
算中位数
要算出中位数,我们必须要能够达成以下几个目标:
将资料依序排出,并找出每一行资料的排名。
找出『中间』的排名为何。举例来说,如果总共有 9 笔资料,那中间排名就是5 (有 4 笔资料比第 5 笔资料大,有 4 笔资料比第 5 笔资料小)。
找出中间排名资料的值。
来看看以下的例子。假设我们有以下的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要找出中位数,我们就键入:
SELECT Sales Median FROM
(SELECTa1.Name, a1.Sales, COUNT(a1.Sales) Rank
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales < a2.Sales
OR(a1.Sales=a2.Sales AND a1.Name <=a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC) a3
WHERE Rank = (SELECT (COUNT(*)+1) DIV 2
FROM Total_Sales);
结果:
Median
20
读者将会发现,第 2 行到第 6 行是跟产生 排名 的语句完全一样。第 7 行则是算出中间的排名。DIV 是在 MySQL 中算出商的方式。在不同的数据库中会有不同的方式求商。第 1 行则是列出排名中间的资料值。
算累积总计
算出累积总计是一个常见的需求,可惜以 SQL 并没有一个很直接的方式达到这个需求。要以 SQL 算出累积总计,基本上的概念与列出排名类似:第一是先做个表格自我连结 (self join),然后将结果依序列出。在做列出排名时,我们算出每一行之前 (包含那一行本身) 有多少行数;而在做累积总计时,我们则是算出每一行之前 (包含那一行本身) 的总合。
来看看以下的例子。假设我们有以下的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出累积总计,我们就键入:
SELECT a1.Name, a1.Sales, SUM(a2.Sales) Running_Total
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.sales
OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name
DESC;
结果:
Name Sales Running_Total
Greg 50 50
Sophia 40 90
Stella 20 110
Jeff 20 130
Jennifer 15 145
John 10 155
在以上的 SQL 语句中, WHERE 子句和
ODER BY 子句让我们能够在有重复值时能够算出正确的累积总计。
算总合百分比
要用 SQL 算出总合百分比,我们需要用到算排名和累积总计的概念,以及运用子查询的做法。在这里,我们把子查询放在外部查询的
SELECT 子句中。让我们来看以下的例子:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出总合百分比,我们键入:
SELECT a1.Name, a1.Sales, a1.Sales/(SELECTSUM(Sales)
FROM Total_Sales) Pct_To_Total
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.sales
OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name
DESC;
结果:
Name Sales Pct_To_Total
Greg 50 0.3226
Sophia 40 0.2581
Stella 20 0.1290
Jeff 20 0.1290
Jennifer 15 0.0968
John 10 0.0645
"SELECTSUM(Sales) FROM Total_Sales" 这一段子查询是用来算出总合。总合算出后,我们就能够将每一行一一除以总合来求出每一行的总合百分比。
算累积总合百分比
要用 SQL 累积总合百分比算出,我们运用类似总合百分比的概念。两者的不同处在于在这个情况下,我们要算出到目前为止的累积总合是所有总合的百分之几,而不是光看每一笔资料是所有总合的百分之几。让我们来看看以下的例子:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出累积总合百分比,我们键入:
SELECT a1.Name, a1.Sales,SUM(a2.Sales)/(SELECT SUM(Sales)
FROM Total_Sales) Pct_To_Total
FROM Total_Sales a1,Total_Sales a2
WHERE a1.Sales <=a2.sales
OR (a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name,a1.Sales
ODER BY a1.Sales
DESC, a1.Name DESC;
结果:
Name Sales Pct_To_Total
Greg 50 0.3226
Sophia 40 0.5806
Stella 20 0.7097
Jeff 20 0.8387
Jennifer 15 0.9355
John 10 1.0000
"SELECTSUM(Sales) FROM Total_Sales" 这一段子查询是用来算出总合。我们接下来用累积总计 "SUM(a2.Sales)" 除以总合来求出每一行的累积总合百分比。
数据类型
1. SQL SERVER的数据类型
SQLServer 提供了 25 种数据类型:
·Binary [(n)]
·Varbinary [(n)]
·Char [(n)]
·Varchar[(n)]
·Nchar[(n)]
·Nvarchar[(n)]
·Datetime
·Smalldatetime
·Decimal[(p[,s])]
·Numeric[(p[,s])]
·Float[(n)]
·Real
·Int
·Smallint
·Tinyint
·Money
·Smallmoney
·Bit
·Cursor
·Sysname
·Timestamp
·Uniqueidentifier
·Text
·Image
·Ntext
(1)二进制数据类型
二进制数据包括 Binary、Varbinary和 Image
Binary 数据类型既可以是固定长度的(Binary),也可以是变长度的。
Binary[(n)] 是 n 位固定的二进制数据。其中,n 的取值范围是从 1到 8000。其存储窨的大小是n + 4 个字节。
Varbinary[(n)] 是 n 位变长度的二进制数据。其中,n 的取值范围是从 1到 8000。其存储窨的大小是n + 4个字节,不是n 个字节。
在 Image 数据类型中存储的数据是以位字符串存储的,不是由 SQL Server 解释的,必须由应用程序来解释。例如,应用程序可以使用BMP、TIEF、GIF 和 JPEG 格式把数据存储在Image 数据类型中。
(2)字符数据类型
字符数据的类型包括 Char,Varchar 和 Text
字符数据是由任何字母、符号和数字任意组合而成的数据。
Varchar 是变长字符数据,其长度不超过 8KB。Char 是定长字符数据,其长度最多为 8KB。超过 8KB 的ASCII 数据可以使用Text数据类型存储。例如,因为 Html 文档全部都是 ASCII 字符,并且在一般情况下长度超过 8KB,所以这些文档可以 Text 数据类型存储在SQLServer 中。
(3)Unicode
数据类型
Unicode 数据类型包括Nchar,Nvarchar 和Ntext
在 Microsoft SQL Server 中,传统的非 Unicode 数据类型允许使用由特定字符集定义的字符。在 SQL Server安装过程中,允许选择一种字符集。使用 Unicode 数据类型,列中可以存储任何由Unicode 标准定义的字符。在Unicode 标准中,包括了以各种字符集定义的全部字符。使用Unicode数据类型,所战胜的窨是使用非 Unicode 数据类型所占用的窨大小的两倍。
在 SQLServer 中,Unicode 数据以 Nchar、Nvarchar 和 Ntext 数据类型存储。使用这种字符类型存储的列可以存储多个字符集中的字符。当列的长度变化时,应该使用Nvarchar 字符类型,这时最多可以存储 4000 个字符。当列的长度固定不变时,应该使用 Nchar 字符类型,同样,这时最多可以存储4000 个字符。当使用 Ntext 数据类型时,该列可以存储多于 4000 个字符。
(4)日期和时间数据类型
日期和时间数据类型包括 Datetime 和Smalldatetime两种类型
日期和时间数据类型由有效的日期和时间组成。例如,有效的日期和时间数据包括“4/01/98 12:15:00:00:00 PM”和“1:28:29:15:01AM 8/17/98”。前一个数据类型是日期在前,时间在后一个数据类型是霎时间在前,日期在后。在 Microsoft SQL Server中,日期和时间数据类型包括Datetime 和 Smalldatetime 两种类型时,所存储的日期范围是从 1753 年 1 月 1 日开始,到9999年12 月 31 日结束(每一个值要求 8 个存储字节)。使用
Smalldatetime 数据类型时,所存储的日期范围是 1900年 1 月 1日 开始,到 2079 年 12 月 31 日结束(每一个值要求 4 个存储字节)。
日期的格式可以设定。设置日期格式的命令如下:
Set DateFormat {format | @format _var|
其中,format | @format_var 是日期的顺序。有效的参数包括 MDY、DMY、YMD、YDM、MYD 和 DYM。在默认情况下,日期格式为MDY。
例如,当执行Set DateFormat YMD 之后,日期的格式为年 月 日 形式;当执行 Set DateFormat DMY 之后,日期的格式为日 月有年 形式
(5)数字数据类型
数字数据只包含数字。数字数据类型包括正数和负数、小数(浮点数)和整数
整数由正整数和负整数组成,例如 39、25、0-2 和 33967。在Micrsoft SQL Server 中,整数存储的数据类型是 Int,Smallint和 Tinyint。Int 数据类型存储数据的范围大于 Smallint 数据类型存储数据的范围,而 Smallint 据类型存储数据的范围大于Tinyint 数据类型存储数据的范围。使用 Int 数据狗昔存储数据的范围是从 -2 147 483 648 到 2 147483 647(每一个值要求4个字节存储空间)。使用 Smallint
数据类型时,存储数据的范围从 -32 768 到 32 767(每一个值要求2个字节存储空间)。使用Tinyint 数据类型时,存储数据的范围是从0 到255(每一个值要求1个字节存储空间)。
精确小娄数据在 SQL Server 中的数据类型是Decimal 和 Numeric。这种数据所占的存储空间根据该数据的位数后的位数来确定。
在SQLServer 中,近似小数数据的数据类型是 Float 和 Real。例如,三分之一这个分数记作。3333333,当使用近似数据类型时能准确表示。因此,从系统中检索到的数据可能与存储在该列中数据不完全一样。
(6)货币数据表示正的或者负的货币数量。
在 Microsoft SQL Server 中,货币数据的数据类型是Money 和Smallmoney
Money数据类型要求 8 个存储字节,Smallmoney 数据类型要求 4 个存储字节。
(7)特殊数据类型
特殊数据类型包括前面没有提过的数据类型。特殊的数据类型有3种,即 Timestamp、Bit 和Uniqueidentifier。
Timestamp 用于表示SQLServer 活动的先后顺序,以二进投影的格式表示。Timestamp 数据与插入数据或者日期和时间没有关系。
Bit 由 1 或者 0 组成。当表示真或者假、ON 或者 OFF 时,使用 Bit 数据类型。例如,询问是否是每一次访问的客户机请求可以存储在这种数据类型的列中。
Uniqueidentifier 由 16 字节的十六进制数字组成,表示一个全局唯一的。当表的记录行要求唯一时,GUID是非常有用。例如,在客户标识号列使用这种数据类型可以区别不同的客户。
2.用户定义的数据类型
用户定义的数据类型基于在 Microsoft SQL Server 中提供的数据类型。当几个表中必须存储同一种数据类型时,并且为保证这些列有相同的数据类型、长度和可空性时,可以使用用户定义的数据类型。例如,可定义一种称为 postal_code 的数据类型,它基于 Char 数据类型。
当创建用户定义的数据类型时,必须提供三个数:数据类型的名称、所基于的系统数据类型和数据类型的可空性。
(1)创建用户定义的数据类型
创建用户定义的数据类型可以使用 Transact-SQL 语句。系统存储过程sp_addtype 可以来创建用户定义的数据类型。其语法形式如下:
sp_addtype{type},[,system_data_bype][,‘null_type‘]
其中,type 是用户定义的数据类型的名称。system_data_type 是系统提供的数据类型,例如 Decimal、Int、Char等等。null_type 表示该数据类型是如何处理空值的,必须使用单引号引起来,例如‘NULL‘、‘NOTNULL‘或者‘NONULL‘。
例子:
Use cust
Exec sp_addtype ssn,‘Varchar(11)‘,"Not Null‘
创建一个用户定义的数据类型 ssn,其基于的系统数据类型是变长为11 的字符,不允许空。
例子:
Use cust
Exec sp_addtype birthday,datetime,‘Null‘
创建一个用户定义的数据类型 birthday,其基于的系统数据类型是 DateTime,允许空。
例子:
Use master
Exec sp_addtype telephone,‘varchar(24),‘Not Null‘
Eexc sp_addtype fax,‘varchar(24)‘,‘Null‘
创建两个数据类型,即telephone 和 fax
(2)删除用户定义的数据类型
当用户定义的数据类型不需要时,可删除。删除用户定义的数据类型的命令是 sp_droptype {‘type‘}。
例子:
Use master
Exec sp_droptype ‘ssn‘
注意:当表中的列还正在使用用户定义的数据类型时,或者在其上面还绑定有默认或者规则时,这种用户定义的数据类型不能删除。
SQL SERVER的字段类型说明
以下为SQL SERVER7.0以上版本的字段类型说明。SQL SERVER6.5的字段类型说明请参考SQL SERVER提供的说明。
字段类型 描述
bit 0或1的整型数字
int 从-2^31(-2,147,483,648)到2^31(2,147,483,647)的整型数字
smallint 从-2^15(-32,768)到2^15(32,767)的整型数字
tinyint 从0到255的整型数字
decimal 从-10^38到10^38-1的定精度与有效位数的数字
numeric decimal的同义词
money 从-2^63(-922,337,203,685,477.5808)到2^63-1(922,337,203,685,477.5807)的货币数据,最小货币单位千分之十
smallmoney 从-214,748.3648到214,748.3647的货币数据,最小货币单位千分之十
float 从-1.79E+308到1.79E+308可变精度的数字
real 从-3.04E+38到3.04E+38可变精度的数字
datetime 从1753年1月1日到9999年12日31的日期和时间数据,最小时间单位为百分之三秒或3.33毫秒
smalldatetime 从1900年1月1日到2079年6月6日的日期和时间数据,最小时间单位为分钟
timestamp 时间戳,一个数据库宽度的唯一数字
uniqueidentifier 全球唯一标识符GUID
char 定长非Unicode的字符型数据,最大长度为8000
varchar 变长非Unicode的字符型数据,最大长度为8000
text 变长非Unicode的字符型数据,最大长度为2^31-1(2G)
nchar 定长Unicode的字符型数据,最大长度为8000
nvarchar 变长Unicode的字符型数据,最大长度为8000
ntext 变长Unicode的字符型数据,最大长度为2^31-1(2G)
binary 定长二进制数据,最大长度为8000
varbinary 变长二进制数据,最大长度为8000
image 变长二进制数据,最大长度为2^31-1(2G)
SQL语法
SELECT
SELECT "栏位" FROM "表格名"
DISTINCT
SELECT DISTINCT"栏位"
FROM "表格名"
WHERE
SELECT "栏位"
FROM "表格名"
WHERE "condition"
AND /OR
SELECT "栏位"
FROM "表格名"
WHERE "简单条件"
{[AND|OR] "简单条件"}+
In
SELECT "栏位"
FROM "表格名"
WHERE "栏位" IN (‘值1‘, ‘值2‘, ...)
Between
SELECT "栏位"
FROM "表格名"
WHERE "栏位" BETWEEN ‘值1‘
AND‘值2‘
Like
SELECT "栏位"
FROM "表格名"
WHERE "栏位" LIKE {模式}
ODER BY
SELECT "栏位"
FROM "表格名"
[WHERE"条件"]
ODER BY "栏位" [ASC,
DESC]
Count
SELECT COUNT("栏位")
FROM "表格名"
GROUP BY
SELECT "栏位1", SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING
SELECT "栏位1", SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件)