详解SQL Server中的数据类型

论坛 期权论坛 脚本     
niminba   2021-5-23 04:28   2298   0

前言

前面几篇文章我们讲解了索引有关知识,这一节我们再继续我们下面内容讲解,简短的内容,深入的理解。

数据类型

SQL Server支持两种字符数据类型,一种是常规,另外一种则是Unicode。常规数据类型包括CHAR和VARCHAR,Unicode数据类型包括NCAHR和NVARCHAR。常规字符的每个字符使用1个字节存储,而Unicode数据的每个字符要求2个字节。常规字符列限制为仅仅只针对于英语,而Unicode则是针对于多种语言。两种字符数据类型的文本表示方式也不相同,在表示常规字符文本时,只需要使用单引号,比如'Hello,my name is JeffckyWang,I'm from cnblogs',而对于Unicode字符文本时,需要指定字符N作为前缀,即N‘Hello,my name is JeffckyWang,I'm from cnblogs'。

名称中没有VAR元素的任何数据类型(CHAR、NCHAR)具有固定长度,即SQL Server按照列定义大小保留行空间,而不是按照字符中的实际字符保留空间。比如某列定义大小为CHAR(25),则SQL Server在该行保留25个字符的空间,而不管存储字符串的长度。

名称中含有VAR元素的数据类型(VARCHAR、NVARCHAR)具有可变长度,即SQL Server根据存储需要,在行中使用尽可能多的存储空间存储字符串,同时外加两个额外的字节偏移数据。例如,如果将某列定义为VARCHAR(25),此时支持的最大字符数为25,但实际上按照字符串中实际字符确定存储量。-摘抄自SQL Server 2012 T-SQL基础教程。

这里关于Unicode字符数据类型我们需要重点理解下。我们先创建一个表,如下:

CREATE TABLE UnicodeType
(
 firstname VARCHAR(5) NOT NULL,
 lastname NVARCHAR(5) NOT NULL
);

此时我们手动插入数据,正常插入,如下:

INSERT dbo.UnicodeType
  ( firstname, lastname )
VALUES ( '11111', -- firstname - varchar(5)
   N'啊的发个好' -- lastname - nvarchar(5)
   )

字符都完全插入表中,如下:

此时我们将firstname,插入五个中文试试如下:

INSERT dbo.UnicodeType
  ( firstname, lastname )
VALUES ( '达得到让人', -- firstname - varchar(5)
   N'达得到让人' -- lastname - nvarchar(5)
   )

此时出现如下结果:

也就是说在常规字符类型如上述VARVHAR中定义为五个字符,此时我们插入五个中文字符则会被截取,当然也插入不进去。因为上述已经明确讲了1个非英语字符串相当于两个字节,此时中文所占用的是十个字节,而此时VARCHAR才五个字符,所以出现警告。我们再来将firstname插入两个中文两个英文或者数字看看

INSERT dbo.UnicodeType
  ( firstname, lastname )
VALUES ( '达得1', -- firstname - varchar(5)
   N'达得到让人' -- lastname - nvarchar(5)
   )

此时插入进去为出现警告,因为此时两个中文字符即四个字节加上一个数字字节刚好五个字节,所以能正常插入,我们再来看看lastname,由上知,既然英文或者数字被当做一个字节,那么我们对lastname插入四个中文字符和两个英文字节刚好十个字节应该是好使的。我们看看:

INSERT dbo.UnicodeType
  ( firstname, lastname )
VALUES ( '达得1', -- firstname - varchar(5)
   N'达得到让ab' -- lastname - nvarchar(5)
   )

oh,shit,此时居然出错了,如下:

我们上述分析的不是有理有据么,难道这里英文不是占用一个字节么,我们插入一个英文试试。

INSERT dbo.UnicodeType
  ( firstname, lastname )
VALUES ( '达得1', -- firstname - varchar(5)
   N'达得到让b' -- lastname - nvarchar(5)
   )

结果正确了,实践是检验真理的唯一标准,从这里我们可以看出:在常规字符中,一个中文会当做是两个字节来使用,一个英文会当做是一个字节使用,但是在Unicode中,一个中文也是会当做两个字节来使用,但是一个英文也会当做是两个字节来使用。至此我们可以得出结论,个人一直以为在Unicode中,将英文是作为一个字节存储,见识短啊。

常规字符和Unicode中一个中文字符用两个字节存储,而对英文,常规字符用一个字节存储,而Unicode依然是用两个字节存储。

字符串函数

对字符串操作的函数有SUBSTRING、LEFT、RIGHT、^[z^K;niKZN[.iyiz~ZyYKNkX{nKZIZIiJ

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:1060120
帖子:212021
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP