开篇先自我检讨一下,写了博客几年以来首次试过连续两个月没出过博文,有客观也有主观原因,但是最近这年里博文数量也越来越少,博文的质量也每况日下。希望自己一直能坚持下来,多写写博文,这月尽量多写几篇来弥补上两个月的。
话说我们的DBA妹子离开我们也两月了。在DBA不在的日子里,小伙伴只能靠自己了。但貌似我的数据库技术还是定格在她离开的时候。
动态SQL
她当时教我最厉害的一招利用SQL生成SQL最终执行查询,大致就是通过sys.table查出表名,生成SQL并合并,最后exec执行。感觉还是比较有用。假设数据库中有一堆命名规范且结构相似的表,要查出这批表的数据,就可以考虑一下用这样的方式
首先从把表名查出来
SELECT name FROM sys.tables WHERE name like ‘%表名的模式%‘ AND type= ‘U‘
上面的通配符什么的就不说了,接下来就是要把查询数据的SQL语句拼接出来了。原来还可以这样用,看来以前是没开窍或者是太老实了。
SELECT ‘ UNION SELECT * FROM ‘+ name FROM sys.tables WHERE name like ‘%表名的模式%‘ AND type=‘U‘
这样查询出来的结果就是最终SQL的半成品。但上面我觉得尽量不要用*,这里有表的结构不一样,UNION就会出错了。接下来还需要经过组合和截取,这里就用到了两个函数,一个是 FOR XML PATH(‘‘),另一个是stuff(),顺序是先让上面的结果合并成一个字符串,再去截取。SQL就成下面的样子
DECLARE @sql varchar(max) SET @sql= SELECT ‘ UNION SELECT * FROM ‘+ name FROM sys.tables WHERE name like ‘%表名的模式%‘ AND type=‘U‘ FOR XML PATH(‘‘) Set @sql=stuff(@sql,1,7,‘ ‘) Select @sql
这样就可以把SQL语句显示出来了,需要执行的话只需要exec(@sql)就可以了。
这样语句不光可以用于查询数据,加入我要批量删除某一类的表 这样的操作也可以,但有个弊端,就是varchar(max)的容量有限,假如表或者语句太大,varchar(max)放不下的话,最终执行的SQL肯定达不到效果啦!
关联子查询
在上一家公司里面,彬哥教导我们,不要用子查询,会让查询速度变慢的,但是这位DBA教我用了联表子查询,原本的子查询放在FORM子句中;DBA教导的是把子查询放到JOIN子句中,当我提到说影响效率,DBA说不会,我也不明白了。这种语句说应用场景也比较多,我举个例子。
假如现在有一张成绩表,需要查询每个同学去除他整个学期所有测试中最高和最低分的结果,这种情况,关联的子查询适合了
SELECT a.* FROM Exam AS a LEFT JOIN (SELECT [name],MAX(score) AS MaxScore,MIN(score) AS MinScore FROM Exam GROUP BY [name] HAVING MAX(score)<>MIN(score) ) AS b ON a.name=b.name AND a.score<>b.MaxScore AND a.score<>b.MinScore WHERE b.name IS NOT NULL
从下面开始则是个人积累阶段了
去除重复
去除重复会涉及到子查询,但子查询会分在FROM子句关联的子查询和直接在WHERE子句里面。共同点在于把视为重复的若干列先分组把他们的键查出来,然后在另一个查询中把最大或最小的保留,其余的DELETE,又拿Exam(id,name,score,subject)表为例,单科只需要一个成绩,其余的去掉。
DELETE FROM Exam WHERE id NOT IN ( SELECT MIN(id) FROM Exam GROUP BY name,subject )
另外一种在FROM子句的关联删除会在联表删除中列出来,假如没有主键,或组合主键不便于值用一个值去唯一标识这一行的,我想到的另一个办法是:建临时表#temptable,然后INSERT #temptable SELECT DESTINCT ,接着把原表删除,最后把临时表的数据INSERT去原表并把临时表删掉就得了,这个用在大数据量不知是否会合适。
联表更新
联表更新只是很基本的SQL语法而已,只是鄙人基本功不够扎实,就记录一下
UPDATE a SET a.value=b.monvalue WHERE table1 AS a INNER JOIN table2 AS B ON a.id=b.id WHERE …….
在这里顺便几下SQLite的
UPDATE table1 SET value=(SELECT monvalue FROM table2 where id=table1.id )
还有MySQL的
UPDATE table1 AS a,table2 AS b SET a.value=b.monvalue WHERE a.id=b.id
联表删除
与上面说的删除重复数据相照应,直接上SQL
DELETE a FROM Exam AS a LEFT JOIN ( SELECT MIN(id) FROM Exam GROUP BY name,subject ) AS b ON a.id=b.id WHERE b.id IS NULL
Case when
Case when 实际上有两种格式,简单一点的是case函数形式,如下面情况
Case sex When ‘1‘ THEN ‘男‘ WHEN ‘2‘ THEN ‘女‘ ELSE ‘其他‘ END
另外一种形式叫case搜索函数,就像下面这样子
Case when sex=‘1‘ THEN ‘‘ When sex=‘2‘ THEN ‘女‘ ELSE ‘其他‘ END
个人认为case when 在查询中实现了分支判断的效果,单纯从外观语法上case函数形式会简介,但从效果来说case函数适合于分支判定是离散的值时适合;case搜索函数是适合于一定的范围,或者说自由度更广的一些判定条件,当然这个也包含了离散的值这个状况。但是case 搜索函数在判定好一个条件符合之后则会屏蔽后面合适的条件。像下面这条语句是能分清各个成绩的等级的
SELECT *,CASE WHEN score >90 THEN ‘优秀‘ WHEN score>80 THEN ‘良好‘ WHEN score>60 THEN ‘合格‘ ELSE ‘不合格‘ END FROM Exam
但是下面就只有合格与不合格两种等级了
SELECT *,CASE WHEN score>60 THEN ‘合格‘ WHEN score>80 THEN ‘良好‘ WHEN score >90 THEN ‘优秀‘ ELSE ‘不合格‘ END FROM Exam
之前鄙人一直在写case when … is null 这样的语句,老是不断尝试看语法又没出错,区分好case函数和case 搜索函数之后就明白,该用case when … is null 而不是case … when is null这样了。
行转列
现在数据库里面的表老是说横向表,纵向表,横向表就例如下面的表结构SubjectTest(id,name,subject,score)。假如要展示的结果是(学生,语文,数学,英语)这样的结果时则需要用到行转列
行转列有用到上面case when语句,大概是先把记录按姓名去分组,然后从分组中把各个分数用case分离出来,再用聚集函数求最值或者是求和,语句就这样子
select name, MAX( CASE [subject] WHEN ‘语文‘ THEN [score] ELSE 0 END ) AS ‘语文‘, MAX( CASE [subject] WHEN ‘数学‘ THEN [score] ELSE 0 END ) AS ‘数学‘, MAX( CASE [subject] WHEN ‘英语‘ THEN [score] ELSE 0 END ) AS ‘英语‘, SUM([score]) AS ‘总分‘, AVG([score]) AS ‘平均分‘ FROM SubjectTest GROUP BY [name]
原来也就这么一回事,当科目多了,MAX除了要多写几次外,还可以用用DBA妹子教的SQL拼凑生成把语句生成出来在执行,可惜视图View不支持这样子,唉!
在SQL Server 2005以上有另外一种方式pivot,直接上语句
SELECT * FROM subjecttest PIVOT( SUM(score) FOR [subject] IN( 语文,数学,英语 ) ) a
我很奇怪网上说的结果都是合并好的,而我的结果却是这个样子
有行转列,也会有列转行,不过这个更没意思,但顺带也说说UNPIOVT
select name,‘语文‘,语文 as score FROM SubjectTest UNION ALL select name,‘数学‘,数学 as score FROM SubjectTest UNION ALL select name,‘英语‘,英语 as score FROM SubjectTest
SELECT * FROM subjecttest UNPIVOT ( score for [subject] IN (语文,数学,英语) ) a
Month year day 函数
这几个函数用于求日期的相应部分,顾名思义是月份,年份,天数
DECLARE @testTimePoint DateTime SET @testTimePoint=‘2015-10-23‘ SELECT YEAR(@testTimePoint) AS 年,MONTH(@testTimePoint) AS 月,DAY(@testTimePoint) AS 日
Cast函数
Cast函数用于作为数据类型转换,使用它有三点要注意
(1)两个表达式的数据类型完全相同。;
(2)两个表达式可隐性转换。
(3)必须显式转换数据类型。
像下面这样子是会报错的
SELECT CAST(‘12.3‘ AS int)
因为‘12.3‘只能转到浮点数,不能转成整形,但是浮点数能转成整形,要让它能成功转,就得这样子
SELECT CAST( CAST(‘12.3‘ AS Float) AS Int)
写完这篇博文后,我发现比之前DBA走的时候,长进了一点点了。我只是想当一名合格的程序员。