当前位置：Gxlcms > 数据库问题 > 数据库复习（SQL）（转）

数据库复习（SQL）（转）

时间：2021-07-01 10:21:17 帮助过：4人阅读

数据模型由三部分组成：

(1)数据结构：定义数据的结构；

(2)数据操作：CRUD；

(3)数据约束：比如键约束、完整性约束等；

数据模型介绍

1.关系数据模型

将数据描述成二维表的形式，例如：

关系模型的特点：

(1)建模方便，操作简单（SQL）；

(2)高效性(访问快速)、易用性；

(3)描述数据单一，即用表来表述数据；

2.半结构化数据模型

将数据描述成类似于XML的形式，例如：

3.对象关系模型

关系的属性不仅仅是基本数据类型，并且每个关系都有相关的方法；

4.层次模型

基于树结构的模型，在物理层次进行操作，很不方便；

5.网状模型

基于图结构的模型，也是在物理层次进行操作，很不方便；

关系模型术语

关系模型约定：属性具有原子性，即每个属性都是基本的数据类型；

关系：二维表；

属性：每列为一个属性；

元组：每一行为一个元组，即记录；

分量（component）：元组的每个属性值就是一个分量；

表模式：由表名、表的属性、属性的数据类型组成；

数据库模式：多个表的模式；

域：属性的数据类型；

实例：表就是关系的实例，当然，如果随着时间的改变，表发生改变，但是他仍然是关系的实例；

当前实例：当前表的数据集；

超键：能够确定一个元组的属性集；

候选键：最小的超键；

主键：设计者选定的候选键；

主属性：包含于候选码的一个属性；比如如果候选码为AB,则主属性可以是A，B，只要包含于候选码的单个属性即可；

一般我们都是通过新建一个虚拟键作为主键，比如学校里有学号，社会上有身份证号，书有书号等；

就上图来说，

关系：account；

属性：account_number、balance；

元组：（A-101，500），....；

第一个元组的第一个分量：A-101；

表模式：account（account_number，balance）；

数据库模式未知；

account_number的域：string，balance的域为int；

实例为现在account的这张表；

超键可以为（account_number，balance）、（account_number）；

候选键为（account_number）；

主键根据设计者自行选定；

问：比较以下两个关系，是否为同一个关系？

答：是的，这两个关系只是把属性的顺序以及元组的顺序改变了，但是他们还是同一个关系，只是表现形式不同；

SQL初步

SQL是专门用于关系模式的查询语言，他是高度抽象化的；

SQL的版本有最早的 ANSI SQL-->SQL92-->SQL99-->SQL2003

现在的各大商业数据库都是有各自版本的SQL，比如SQL Server对应T-SQL，而Oracle对应PL/SQL；

SQL中存在DDL和DML；

SQL默认是基于包的数据库，即允许一个表中存在重复的元组；

SQL不区分大小写，包括关键字，表名，属性名等都是，但是字符串是大小写敏感的；比如：FROM 和 from是一样的，表明Table和tablE是一样的，属性名Attr和attR是一样的；

SQL中的比较运算符：需要注意的是两个运算符，=和<>分别表示相等和不等，不能使用！=来表示不等；

字符串连接运算符：+，即‘xiaz‘+‘dong‘；

字符串是用单引号括起来的；

DDL语句

(1)CREATE TABLE创建表模式；

(2)ALTER TABLE 修改表模式，比如：

ALTER TABLE t1 ADD age int；

ALTER TABLE t1 DROP age；

(3)DROP TABLE 删除表模式，比如：

DROP TABLE t1；

小知识点：如果想要为某个属性定义默认值，可以在属性声明后面加上 DEFAULT 值；

比如：age int DEFAULT 0；

基本数据类型

(1) INT；

(2)DECIMAL，指定小数点位数，DECIMAL(n,d) 表示一共n位有效数字，d个小数位；

(3)VARCHAR；变长的字符串，比如VARCHAR(5)表示最多长度为5的字符串；

(4)CHAR：固定长度的字符串，比如 CHAR(5)表示长度为5的字符串；

(5)DATE，DATE‘2010-02-03‘

(6)TIME：时间，由时、分、秒、微秒组成，TIME ‘14:00:20‘ 表示 14时00分20秒；

(7)TIMESTAMP：由DATE和TIME组成；

(5)BOOLEAN：TRUE、FALSE、UNKNOWN；

(6)位串BIT；B‘0010‘

问：CHAR(3)和VARCHAR(3)有什么区别？

答：如下图所示: 虽然这两种数据类型的存储方式不同，但是如果char(3)类型的‘a‘和varchar(3)类型的‘a‘是相等的；

技术分享

注意：SQL中string是用单引号括起来的；

问：数据库和表的关系？

答：数据库中含有多个表，不能单纯的创建表；

问：PRIMARY KEY和UNIQUE有什么区别？

答：PRIMARY KEY 和UNIQUE都表示属性能够区别所有元组，但是PRIMARY KEY 不能存在NULL值，而UNIQUE允许NULL值；

问：类似PRIMARY KEY这种约束声明在哪？

答：可以声明在两个地方，

CREATE TABLE person(

id INT PRIMARY KEY,

name VARCHAR(20),

ismale boolean DEFAULT TRUE,

birth DATE,

salary DECIMAL(6,2)

);

或者

CREATE TABLE person(

id INT,

name VARCHAR(20),

ismale boolean DEFAULT TRUE,

birth DATE,

salary DECIMAL(6,2)，

PRIMARY KEY(id)

);

示例：

技术分享

SQL查询

原始Person表有如下数据：

技术分享

规范：

SELECT attr1,attr2....attrn

FROM table1

WHERE predicate；

执行顺序：先FROM，再where后SELECT；

AS 可用来重命名属性或关系，比如：

SELECT id AS 学号,name AS 姓名,age AS 年龄,‘ECNU‘ AS 学校

FROM Person

运行结果如下所示：

技术分享

从上图中可以看出，列被重命名，而且还多加了一个“学校”的属性，因此在SELECT 中可以用AS重命名，而且还可以添加新的列；

字符串的操作

1.字符串的连接：+

2.字符串的额比较：<，>，<>，=，<=，>=；

3.字符串的模式匹配：%和 _ 分别表示任意多个字符和单个任意字符；比如‘xiazdong‘匹配‘xia%‘，‘xia_ _ _ _ _‘；

S LIKE P：S匹配模式P时返回true；

S NOT LIKE P： S不匹配模式P时返回true；

字符串中两个连续的单引号表示一个单引号，比如‘a‘‘a‘表示字符串a‘a；

我们可以通过ESCAPE ‘字符‘定义转义字符，比如ESCAPE ‘\‘就表名定义\为转义字符，即\%表示真实的%，而不是模式匹配的%；

比如：name LIKE ‘xia\%\_%‘ ESCAPE ‘\‘表示\作为转义字符，并且名字是以xia%_开头的字符串；

举例：

如果Person表存在以下数据：

技术分享

可以通过如下语句进行查找

SELECT *

FROM Person

WHERE name LIKE ‘xia!%!_%‘ ESCAPE ‘!‘

就可以查找到此记录；

技术分享

SQL日期操作

SQL日期分为：

(1)DATE：由年月日组成，标准格式为‘yyyy-MM-dd‘；

(2)TIME：由小时、分钟、秒组成，标准格式为‘HH:mm:ss‘；

(3)TIMESTAMP：由DATE和TIME组合而成，标准的格式为‘yyyy-MM-dd HH:mm:ss‘；

日期实例：

DATE ‘2012-04-25‘ 表示 2012年4月25日；

TIME ‘14:30:00‘ 表示14点30分00秒；

TIMESTAMP ‘2012-04-25 14:30:00‘ 表示2012年4月25日 14点30分00秒；

日期操作是可以通过一般的比较运算符进行比较的；

实例：

Person表结构如下所示：

CREATE TABLE `person` (

‘id‘ int(20),

‘name‘ varchar(20),

‘age‘ varchar(20),

‘birth‘ date,

‘meeting‘ time,

‘graduate‘ timestamp

PRIMARY KEY (`id`)

);

插入语句为：

INSERT INTO Person VALUES (10,‘xiazdong-10‘,30,DATE‘1991-12-10‘ , TIME‘15:00:00‘,TIMESTAMP‘2012-02-02 14:20:00‘ );

NULL操作

1.NULL值和任意值算术运算都是空值；

2. NULL值和任意值比较运算都是UNKNOWN值；

比如：

a=null,b=5,则a+b为null；

a=null,b=5,则a>5为UNKNOWN；

判断是否为NULL的语句为a IS NULL 或 a IS NOT NULL；

技术分享

问：SELECT * FROM Person WHERE age>0 OR age<=0是否会返回全部的元组呢？

答：不会。因为如果age的值为null，则age>0为UNKNOWN，age<=0为UNKNOWN，则不返回；

排序操作

ORDER BY 属性 [asc\desc]；

ORDER BY子句一定要放在所有语句的后面，即ORDER BY放在GROUP BY \HAVING等的后面；

举例：

对于Person表，如下语句：

SELECT * FROM PERSON

ORDER BY name,id DESC；

表明先以name值降序排列，当name值相等时然后以id值降序排列；

ORDER BY后面的属性可以是表达式，比如：

ORDER BY id+age,age+score；表示先以id+age的总数升序排序，如果id+age相等的话，则再以age+score升序排序；

不同表的属性重名问题

比如：

技术分享

在Person中Name和Course中Name属性不是一个含义，因此如果以下语句：

SELECT P.Name as stuName , C.Name as CourseName , C.teacherName

FROM Person as P,Course as C

WHERE P.name=C.stuName

为了区分不同表的name属性，我们需要在属性前面加上表的名称，并且还在SELECT 子句中重命名属性；

元组变量：像以上语句的Person as P ，其中P就是元组变量；

并、交、差运算

UNION || UNION ALL：对于集合操作的并；

INTERSECT|| INTERSECT ALL：集合的交；

EXCEPT || EXCEPT ALL：集合的差；

注意：

(1)比如UNION 后的关系需要去重复，因为是集合操作；而UNION ALL后的关系不需要去重复；

(2)需要保证集合操作的关系属性名要相等，不能出现比如：SELECT NAME FROM PERSON union SELECT AGE FROM PERSON；的情况；

举例：

（SELECT name FROM person）

UNION

（SELECT stuname AS name FROM course）；

连接操作

1.交叉连接 CROSS JOIN

最基础的连接类似于直接用逗号分割，但是有一个区别：

A CROSS JOIN B ：A不能等于B，即A和B不能是一张表；

A，B：没有以上限制；

2.自然连接 NATURAL JOIN

A NATURAL JOIN B：将A和B表中属性名相同的两列进行比较，如果值相等，则合并；

比如：

SELECT * FROM Person as A NATURAL JOIN Person as B；

3.θ连接 JOIN ON

A JOIN B ON predicate；

比如：

select * from person as B JOIN person as A ON A.id=B.id

4.外连接 OUTER JOIN

A [FULL | LEFT | RIGHT ] OUTER JOIN B；

A NATURAL LEFT OUTER JOIN B：在自然连接的基础上，保留A中不能匹配的元组，并将B中独有的属性处设为NULL；

举例：

技术分享

loan left outer join borrower on loan.loan_number = borrower.loan_number

技术分享

loan natural right outer join borrower

技术分享

子查询

子查询需要从里向外分析

1.子查询返回一个值

比如 select id from person where id =1 返回的只有一个值 1；

SELECT * FROM Person WHERE id = ( select id from Person WHERE id=1) ;

2.子查询返回一个关系

SELECT * FROM Person WHERE id IN (SELECT id FROM person) ；

2.1子查询位于WHERE中

SELECT * FROM PERSON WHERE ID > ALL (SELECT id FROM person)；

2.2子查询位于FROM中

SELECT * FROM Person，（SELECT id FROM Person） AS P2；

消除重复操作

DISTINCT；

此符号可以放在SELECT后，也可以放在聚集操作之中；

比如：

SELECT DISTINCT person

FROM Person；

分组操作

GROUP BY 和 HAVING；

HAVING子句是对聚集操作符进行限制；

WHERE子句是对一般的属性进行限制；

比如

SELECT age，avg(score)

FROM Person

GROUP BY age

HAVING avg(score)>90

聚集操作

聚集操作忽略null值，比如age有1,2，null，则avg(age)=1.5；

SUM(a)：对a求和；

SUM(DISTINCT a)：在对a求和之前先去除重复；

AVG(a)

AVG(DISTINCT a)：在对a求平均之前先去除重复；

MIN(a)

MIN(DISTINCT a)：在对a求最小值之前先去除重复；

MAX(a)

MAX(DISTINCT a)：在对a求最大值之前先去除重复；

COUNT(a)：计算a属性的个数（不包括null的元组）；

COUNT(DISTINCE a)：在对a计数之前先去除重复；

COUNT(*)：元组的个数（包括null元组）；

补充：Top用法

Top是用来规定返回的元组数目；比如一个数据库表中包含1万个元组，目的是要返回前5个，则可以使用Top；

在SQL Server中语法如下：

SELECT TOP 5 column1,column2.... //规定返回前5个元组，并且列出column1...属性；

FROM Table

比如：

SELECT TOP 5 age

FROM Person

ORDER BY age ；表示列出年纪最小的5个人；

在MySQL中，语法如下：

SELECT *

FROM Table

LIMIT 5;

比如：

SELECT age

FROM Person

LIMIT 5

ORDER BY age； //列出年纪最小的5个人；

其他符号

EXISTS R：如果关系R非空时返回true；

NOT EXISTS R：如果R空，则返回true；

t IN R：如果元组t属于R中的某个元组，则返回true；

t NOT IN R：如果元组t不属于R中的任何一个值，则返回true；

c > ALL R：c值要大于所有R（只有一个列）的记录；

c < ALL R：c值要小于所有R的记录；

c<>ALL R：c不等于R中全部的记录；

c > ANY R：c大于R中一个记录即可；

c = ANY R：c等于R中任意一个记录即可；

c<>ANY R 和 c<>ALL R 的区别

c<>ANY R 表示R中存在一个元组，不等于c，就是说只要R中存在一个元组不等于c，就返回true；

c<>ALL R表示元组c不在R中；

SQL约束

主动元素：一个表达式或语句，编写后存储在数据库中，当某个特定的时间就会被执行；

比如约束、触发器等都是主动元素，因为比如约束的语句存储在数据库中，当插入或更新数据时被调用进行检查；

为约束命名

我们可以形如：

CONSTRAINT [name] [约束]

比如：

CREATE TABLE Person(

id int CONSTRAINT c1 PRIMARY KEY,

name varchar(30)

);

键约束

PRIMARY KEY；

声明方式有两种：

（1）

CREATE TABLE Person(

id int PRIMARY KEY,

name varchar(30)

);

（2）

CREATE TABLE Person(

id int ,

name varchar(30),

PRIMARY KEY (id)

);

外键约束

一个关系中的某个属性为外键，则此属性中的值必须在另一个关系中的主键或唯一性属性中出现；

(1)

CREATE TABLE Course(

id int REFERENCES Person (id), //引用Person表中的主键：id

name varchar(30)

);

(2)

CREATE TABLE Course(

id int ,

name varchar(30),

FOREIGN KEY (id) REFERENCES Person (id)

);

更新时违反外键约束时的动作设置

默认为拒绝此违反约束的操作；

就拿上面的例子讲，如果Course表中有一个元组的id属性为1，对应Person表的id=1，如果Person表的id从1更新为2，则级联修改，Course表的id也随着修改；

如果Course表中有一个元组的id属性为1，对应Person表的id=1，如果Person表的id=1的元组被删除，则Course表的对应元组置空；

我们可以在声明时设置：

ON DELETE CASCADE：当Person的id删除时，Course对应的元组也会被删除；

ON DELETE SET NULL：当Person的id删除时，Course对应的元组会被设为null；

ON UPDATE SET NULL：当Person的id被更新，则Course对应的元组被设为null；

ON UPDATE CASCADE：当Person的id被更新，则Course对应的元组被更新；

(1)

CREATE TABLE Course(

id int REFERENCES Person (id)

ON DELETE SET NULL

ON UPDATE CASCADE, //引用Person表中的主键：id

name varchar(30)

);

推迟约束检查

如果要执行一个事务，而事务执行到一半时可能会违反某个预先设定的约束，但是最后事务提交时，是不违反约束的，（因为默认是执行一条语句检查一次）则可以使用延迟检验；

这个功能MySQL没有提供延迟约束检查的机制；

每个约束都会带有一个设置，可以是deferrable或not deferrable，分别表示可延迟和不可延迟：

(1)可延迟的意思是每次都在事务提交时才检查约束；

(2)不可延迟的意思是每条语句检查约束；

NOT DEFERRABLE 表示不可延迟，如果在声明时设置为不可延迟，则约束都是不可延迟的；

DEFERRABLE INITIALLY IMMEDIATE 表示不可延迟，但是和上面的NOT DEFERRABLE不同，可以对约束进行更改，改为可延迟；

DEFERRABLE INITIALLY DEFERRED 表示可延迟约束；

问：NOT DEFERRABLE和DEFERRABLE INITIALLY IMMEDIATE 的区别

答：两者语义相同，但是区别在于一个可以对约束更改，一个不可以；

NOT DEFERRABLE只要一设定，就不能更改；

DEFERRABLE INITIALLY IMMEDIATE 可以对约束进行更改，改为可延迟，因此比较灵活，比如：

SET CONSTRAINT aa DEFERRED;//将immediate改为deferred；

SET CONSTRAINT aa IMMEDIATE;//将deferred改为immediate；

举例：

（1）

CREATE TABLE Course(

id int REFERENCES Person (id)

DEFERRABLE INITIALLY DEFERRED, //延迟约束检查;

name varchar(30)

);

（2）

SET CONSTRAINT [name] DEFERRED；

也可以将一个约束设置为延迟的；

非空约束

CREATE TABLE Course(

id int REFERENCES Person (id) NOT NULL, // id属性不为空

name varchar(30)

);

CHECK约束

CHECK约束是形如：

CHECK (age>30) 表示age属性药大于30；

CHECK约束括号中的语句可以是任何WHERE子句中的语句；

（1）基于元组的CHECK约束

当CHECK约束涉及此关系中的多个属性时，则使用基于元组的CHECK约束；

当元组被插入或更新时检查；

（2）基于属性的CHECK约束

此CHECK约束只属于一个属性，当属性被插入或更新时检查；

注意：

(1)CHECK对于旧的数据是不检查的，比如在设置CHECK约束前已经插入了违反CHECK约束的数据，则CHECK约束是检查不出的；

(2)基于元组的约束检查次数比基于属性的约束更多；

CREATE TABLE Person(

id int CHECK ( id > 0), //基于属性的约束

gender varchar(1) CHECK(gender in (‘F‘,‘M‘)),

name varchar(30),

PRIMARY KEY (id),

);

CREATE TABLE Person(

id int ,

gender varchar(1),

name varchar(30),

PRIMARY KEY (id),

CHECK ( id > 0 AND CHECK(gender in (‘F‘,‘M‘))) //基于元组的约束

);

数据库复习（SQL）（转）

数据模型由三部分组成：

(1)数据结构：定义数据的结构；

(2)数据操作：CRUD；

(3)数据约束：比如键约束、完整性约束等；

数据模型介绍

1.关系数据模型

将数据描述成二维表的形式，例如：

关系模型的特点：

(1)建模方便，操作简单（SQL）；

(2)高效性(访问快速)、易用性；

(3)描述数据单一，即用表来表述数据；

2.半结构化数据模型

将数据描述成类似于XML的形式，例如：

3.对象关系模型

关系的属性不仅仅是基本数据类型，并且每个关系都有相关的方法；

4.层次模型

基于树结构的模型，在物理层次进行操作，很不方便；

5.网状模型

基于图结构的模型，也是在物理层次进行操作，很不方便；

关系模型术语

关系模型约定：属性具有原子性，即每个属性都是基本的数据类型；

关系：二维表；

属性：每列为一个属性；

元组：每一行为一个元组，即记录；

分量（component）：元组的每个属性值就是一个分量；

表模式：由表名、表的属性、属性的数据类型组成；

数据库模式：多个表的模式；

域：属性的数据类型；

实例：表就是关系的实例，当然，如果随着时间的改变，表发生改变，但是他仍然是关系的实例；

超键：能够确定一个元组的属性集；

候选键：最小的超键；

主键：设计者选定的候选键；

就上图来说，

关系：account；

属性：account_number、balance；

元组：（A-101，500），....；

第一个元组的第一个分量：A-101；

表模式：account（account_number，balance）；

数据库模式未知；

account_number的域：string，balance的域为int；

实例为现在account的这张表；

超键可以为（account_number，balance）、（account_number）；

候选键为（account_number）；

主键根据设计者自行选定；

问：比较以下两个关系，是否为同一个关系？

SQL初步

DDL语句

基本数据类型

问：CHAR(3)和VARCHAR(3)有什么区别？

问：数据库和表的关系？

问：PRIMARY KEY和UNIQUE有什么区别？

问：类似PRIMARY KEY这种约束声明在哪？

SQL查询

人气教程排行