关于SQL SERVER的N前缀的理解

加N前缀指定后面的字符串为UNICODE常量, SQL Server 的 Unicode 数据类型是基于 SQL-92 标准中的国家字符数据类型。SQL-92 使用前缀字符 N 标识这些数据类型及其值。
1, Unicode 数据使用 SQL Server 中的 nchar、varchar 和 ntext 数据类型进行存储。对于存1储来源于多种字符集的字符的列,可采用这些数据类型。当列中各项所包含的 Unicode 字符数不同时(至多为 4000),使用 nvarchar 类型。当列中各项为同一固定长度时(至多为 4000 个 Unicode 字符),使用 nchar 类型。当列中任意项超过 4000 个 Unicode字符时,使用 ntext 类型。

在 Microsoft SQL Server  2000 中,传统上非 Unicode 数据类型允许使用由特定字符集定义的字符。字符集是在安装 SQL Server 时选择的,不能更改。使用 非Unicode 数据类型存储数据时,如varchar, char, text等,如果未指定字符排序序列时(字符集),使用默认的字符集,即使为某个字段指定了字符排序序列时,如果SQL Server 默认的排序序列与指定字段的排序序列不同时,不加N的话也会产生乱码,如默认的字符集是单字节的字符集如拉丁字符集(Collation name为Latin1_General_CI_AS)的时候,如果定义Name为Varchar类型,字符集为中文字符集时(Collation name为Chinese_PRC_CI_AS),用如下的插入语句也会乱码

insert a(name) values (‘AA中‘),因为数据插入的时候,默认还是用Latin1_General_CI_AS字符集送到服务器,再转换为Collation name为Chinese_PRC_CI_AS时,产生乱码,但如果改为如下的时候: insert a(name) values (N‘AA中‘) 则能正确插入,因为通过N前缀,以UNICODE的形式送到SQLSERVER,然后再转换成Chinese_PRC_CI_AS时,就不会产生乱码。

2,UNICODE和非UNICODE之间的转换
2-1 UNICODE--〉非UNICODE:Convert(varchar(50), name Collate Chinese_PRC_CS_AS_KS_WS)--name 是nvarvhar类型的,如name是‘AA中‘的时候

Select DATALENGTH(Convert(varchar(50), name Collate Chinese_PRC_CS_AS_KS_WS)) from x, 返回的长度为4(UNICODE的时候为6)

2-2 非UNICODE--〉UNICODE的时候:Convert(nvarchar(50), name)--name是varchar类型的时候如name是‘AA中‘的时候

Select DATALENGTH(Convert(nvarchar(50), name)) from x, 返回的长度为6(非UNICODE的时候为4)

3, 试验归类
测试SQL:
------------------------------------------------------------
drop table a
create table a(a varchar(2))

insert into a values(‘a‘)
insert into a values(N‘a‘)
insert into a values(‘深圳‘)
insert into a values(N‘深圳‘)
select a, len(a), datalength(a) from a

drop table #a
create table a(a varchar(2))

insert into #a values(‘a‘)
insert into #a values(N‘a‘)
insert into #a values(‘深圳‘)
insert into #a values(N‘深圳‘)
select a, len(a), datalength(a) from #a

------------------------------------------------------------
drop table a
create table a(a varchar(8000))

insert into a select REPLICATE(‘a‘, 8000)
insert into a select REPLICATE(‘深‘, 8000)
insert into a select REPLICATE(N‘a‘, 8000)
insert into a select REPLICATE(N‘深‘, 8000)
select a, len(a), datalength(a) from a

3-1. 字符集是支持双字节的字符集如中文字符集(Collation name为Chinese_PRC_CI_AS)

<1>. 定义varchar(2)

   (1) 正式表
    总结:在中文字符集下,定义varchar(x),
     不论使用不使用N‘‘,英文字符都占1个字节,即可以存x个英文字符;
     不论使用不使用N‘‘,中文字符都占2个字节,即可以存(x / 2)个中文,select结果为汉字本身,不是乱码;

   (2) 临时表
    总结:在中文字符集下,定义varchar(x),
     和正式表表现一样;

<2>. 定义nvarchar(2)

   (1) 正式表
    总结:在中文字符集下,定义nvarchar(x),
     不论使用不使用N‘‘,英文字符都占2个字节,即可以存x个英文字符;
     不论使用不使用N‘‘,中文字符都占2个字节,即可以存x个中文,select结果为汉字本身,不是乱码;

   (2) 临时表
    总结:在中文字符集下,定义nvarchar(x),
     和正式表表现一样;

<3>. 类型为varchar时,长度 x 和 datalength()对应,都指字节大小;
     英文len() = datalength();
     中文len() = datalength() / 2;

    类型为nvarchar时,长度 x 和 len()对应,都指字符长度; 

3-2. 字符集是支持单字节的字符集如拉丁字符集(Collation name为Latin1_General_CI_AS)

<1>. 定义varchar(2)

   (1) 正式表
    总结:在英文字符集下,定义varchar(x),
     不论使用不使用N‘‘,英文字符都占1个字节,即可以存x个英文字符;
     不论使用不使用N‘‘,中文字符都占1个字节,即可以存x个中文,但只保存前半截中文编码,所以select结果为乱码;
     (特殊:如果使用N‘‘,此时插入的字符数最大为4000)
     英文和中文 len() = datalength();

   (2) 临时表
    总结:在英文字符集下,定义varchar(x),
     不论使用不使用N‘‘,英文字符都占1个字节,即可以存x个英文字符;
     不使用N‘‘时,中文占1个字节,可以存x个汉字,但都只存入汉字前半截字符编码,显示为乱码;
     使用N‘‘时,中文占2个字节,只可以存 x/2 个汉字,没有乱码,取出仍为汉字,说明在英文字符集下通过使用N‘‘是可以保存汉字的;

     除用N‘‘保存的中文外,其余英文和中文 len() = datalength();
     用N‘‘保存的中文字符len() = datalength() / 2;

<2>. 定义nvarchar(2)

   (1) 正式表
    总结:在英文字符集下,定义nvarchar(x),
     不论使用不使用N‘‘,英文字符都占2个字节,即可以存x个英文字符;(注意每个字符比varchar用的空间大)
     不论使用不使用N‘‘,中文字符都占2个字节,即可以存x个中文字符,
     但不使用N‘‘只保存前半截中文编码,所以select结果为乱码;
     使用N‘‘则保存和取出都为汉字本身;

   (2) 临时表
    总结:在英文字符集下,定义nvarchar(x),
     和正式表表现相同;

<3>. 类型为varchar时,长度 x 和 datalength()对应,都指字节大小;
     (临时表中N‘‘中文字符长度比较特殊;)
    类型为nvarchar时,长度 x 和 len()对应,都指字符长度; 

4、 使用归类
varchar和nvarchar类型的最大长度,得到以下经验:
<1> 最大长度问题
   1. 在中文字符集下使用varchar,最大长度可定义8000,这个8000是指字节数(datalength()),即最大可以保存8000个英文字符,4000个中文字符;
    特殊:若存入字符N‘a‘,则最大能保存4000个字符,但其所占空间为4000字节;
   2. 在中文字符集下使用nvarchar,最大长度可定义4000,这个4000是指字符个数(len()),即最大可以保存4000个英文字符,4000个中文字符;

   3. 在英文字符集下使用varchar,最大长度可定义8000,这个8000是指字节数(datalength()),由于中文英文都保存为1字节,故最大可以保存8000个英文、中文字符;
   4. 在英文字符集下使用nvarchar,最大长度可定义4000,这个4000是指字符个数(len()),即最大可以保存4000个英文字符,4000个中文字符;
<2> 文字显示问题
   1. N‘‘要和数据类型nvarchar, nchar一起使用,如果对varchar, char字段类型强制使用N‘‘,则会产生一些特殊现象,甚至无法控制;
   2. 在英文字符集下,想要保存特殊符号字符、中文等双字节字符,在定义表结构时要使用nvarchar或者nchar,在保存时要用N‘‘;
   3. 在中文字符集下,数据库系统缺省已经可以保存特殊符号字符、中文等双字节字符。即使用不使用N‘‘,都按双字节处理。但为了统一期间建议:
    在定义表结构时如果使用nvarchar或者nchar,在保存时要用N‘‘,
    在定义表结构时如果使用varchar和char,此时不要使用N‘‘操作;
   4. SUBSTRING ( expression , start , length )
    length:是一个整数,指定子串的长度(要返回的字符数或字节数)。
    中文字符集中按字符数取;
    英文字符集中,char, varchar按字节数取,nchar, nvarchar按字符数取;
时间: 2024-10-09 01:23:38

关于SQL SERVER的N前缀的理解的相关文章

SQL Server代理(9/12):理解作业和安全

SQL Server代理是所有实时数据库的核心.代理有很多不明显的用法,因此系统的知识,对于开发人员还是DBA都是有用的.这系列文章会通俗介绍它的很多用法. 在这个系列的前一篇文章里,你学习了如何在SQL Server代理作业步骤里启动外部程序.你可以使用过时的ActiveX系统,从虚拟命令提示符里运行批处理命令,或甚至启动你自己的程序.你的最佳选项是使用PowerShell子系统来运行PowerShell脚本.PowerShell脚本会允许你操纵系统或SQL Server角度的一切.在这篇文章

SQL Server代理(5/12):理解SQL代理错误日志

SQL Server代理是所有实时数据库的核心.代理有很多不明显的用法,因此系统的知识,对于开发人员还是DBA都是有用的.这系列文章会通俗介绍它的很多用法. 如我们在这个系列的前几篇文章所见,SQL Server代理是由一系列的作业步骤组成,每个步骤是不同类型将要进行的工作.如果你在第4篇所见,SQL Server代理也提供使用数据库邮件发送提醒的能力.如果出现问题,不管怎样, 你必须去查看下数据库邮件错误日志.在这篇文章里,你会学到如何理解和查看SQL Server错误日志的所有相关知识.你会

学习 Sql Server 内存管理之术语理解

在学习sql server 内存管理时,看到一些term:memory node,memory clerk,memory object,非常迷惑,在此将自己的理解记录下来,以便后续学习 1,NUMA架构和memory node 内存节点基于硬件 NUMA 创建,memory node是Numa node内的内存块,属于server物理内存的一部分.Memory Node的作用是使得内存的分配由Windows移交到SQL Server OS层面执行. 查看memory node select *

SQL Server中对存储过程的理解

数据库的存储过程理解为,处理数据的子程序,写起来像函数,用起来像函数,在SQL Server中存储过程分为两大类,系统的和自定义的,系统的都放在master系统数据库中,自定义就是自己去写的,用DDL的相关语句即可,创建存储过程,就像函数一样,可以有参,也可以无参,无参的时候写起来很简单: CREATE PROC hello AS BEGIN /*....*/ END GO 执行的时候也是,只需要在自定义存储过程执行即可 EXEC hello 有参的时候写法也不陌生: CREATE PROC h

Sql Server之旅——第二站 理解万恶的表扫描

很久以前我们在写sql的时候,最怕的一件事情就是sql莫名奇妙的超级慢,慢的是撸一管子回来,那个小球还在一直转...这个着急也只有当事人才 明白,后来听说有个什么“评估执行计划“,后来的后来才明白应该避免表扫描... 一:表扫描 1.现象 ”表扫描“听起来很简单,不就是一行一行的扫嘛,你要说”执行计划”的话,我也会玩,为了更可观,我build一个表,再插入三行数据,如下图: 上面的Person我是一个索引都没建,然后where一下,看看表扫描是啥样的??? 果然是看到了万恶的“表扫描”三个字,既

SQL SERVER 索引名前缀代表的意思

PK - Primary Key IX - Non-Unique Index AK - Unique Index (AX should have been AK (Alternate Key)) CK - Check Constraint DF - Default Constraint FK - Foreign Key UK - Unique Key Constraint

理解性能的奥秘——应用程序中慢,SSMS中快(6)——SQL Server如何编译动态SQL

本文属于<理解性能的奥秘--应用程序中慢,SSMS中快>系列 接上文:理解性能的奥秘--应用程序中慢,SSMS中快(5)--案例:如何应对参数嗅探 我们抛开参数嗅探的话题,回到了本系列的最初关注点中:为什么语句在应用程序中慢,但是在SSMS中快?到目前为止,都是在说存储过程的情况.而存储过程的问题通常是因为SET ARITHABORT的不同设置项的原因.如果你的应用不使用存储过程,而是通过中间层提交客户端的查询,那么也有几个原因可能让你的查询因为不同的缓存条目从而使得在SSMS和应用程序中的运

SQL Server :理解数据记录结构

在SQL Server :理解数据页结构我们提到每条记录都有7 bytes的系统行开销,那这个7 bytes行开销到底是一个什么样的结构,我们一起来看下. 数据记录存储我们具体的数据,换句话说,它存在堆表里,或者存在聚集索引的叶子节点.数据记录结构是为了让SQL Server更高效的管理数据.我们来看下数据记录结构示意图: 上图中蓝色部分是所有数据记录部分,绿色部分是表结构里取决于定长/变长列的数据记录部分. 行头系统数据: 用做状态位1的第1字节(8位)是用来定义记录的属性: 第0位:版本信息

SQL Server 2012笔记分享-4:理解SQL server实例

每个单独的SQL server实例都有一个windows进程:sqlservr.exe,一个windows下能安装多个实例,多个实例会有多个sqlservr.exe进程. 一个SQL实例在后台对应一个服务,如果多个应用程序放在一个实例里,如果某个应用开发的程序有问题,比如死循环,会导致服务停止,从而导致所有数据库无法工作.可以采用多实例分开方式. 一个服务器上可以装多个实例,标准版(16个)和企业版(50个)支持的实例数量不同. SQL server实例的类型 (一)默认实例和命名实例 1.服务