当前位置:Gxlcms > 数据库问题 > 数据库复习(SQL)(转)

数据库复习(SQL)(转)

时间:2021-07-01 10:21:17 帮助过:4人阅读

数据模型由三部分组成:

(1)数据结构:定义数据的结构;

(2)数据操作:CRUD;

(3)数据约束:比如键约束、完整性约束等;

 

数据模型介绍

 

1.关系数据模型

 

将数据描述成二维表的形式,例如:

技术分享

关系模型的特点:

(1)建模方便,操作简单(SQL);

(2)高效性(访问快速)、易用性;

(3)描述数据单一,即用表来表述数据;
 

2.半结构化数据模型

 

将数据描述成类似于XML的形式,例如:

技术分享


 

3.对象关系模型

 

关系的属性不仅仅是基本数据类型,并且每个关系都有相关的方法;


 

4.层次模型

 

基于树结构的模型,在物理层次进行操作,很不方便;

 

5.网状模型

 

基于图结构的模型,也是在物理层次进行操作,很不方便;

 

关系模型术语

 

关系模型约定:属性具有原子性,即每个属性都是基本的数据类型;

关系:二维表;

属性:每列为一个属性;

元组:每一行为一个元组,即记录;

分量(component):元组的每个属性值就是一个分量;

表模式:由表名、表的属性、属性的数据类型组成;

数据库模式:多个表的模式;

域:属性的数据类型;

实例:表就是关系的实例,当然,如果随着时间的改变,表发生改变,但是他仍然是关系的实例;

当前实例:当前表的数据集;

超键:能够确定一个元组的属性集;

候选键:最小的超键;

主键:设计者选定的候选键;

主属性:包含于候选码的一个属性;比如如果候选码为AB,则主属性可以是A,B,只要包含于候选码的单个属性即可;

一般我们都是通过新建一个虚拟键作为主键,比如学校里有学号,社会上有身份证号,书有书号等;

技术分享

就上图来说,

关系:account;

属性:account_number、balance;

元组:(A-101,500),....;

第一个元组的第一个分量:A-101;

表模式:account(account_number,balance);

数据库模式未知;

account_number的域:string,balance的域为int;

实例为现在account的这张表;

超键可以为(account_number,balance)、(account_number);

候选键为(account_number);

主键根据设计者自行选定;


问:比较以下两个关系,是否为同一个关系?


技术分享

答:是的,这两个关系只是把属性的顺序以及元组的顺序改变了,但是他们还是同一个关系,只是表现形式不同;


SQL初步


SQL是专门用于关系模式的查询语言,他是高度抽象化的;

SQL的版本有最早的  ANSI SQL-->SQL92-->SQL99-->SQL2003

现在的各大商业数据库都是有各自版本的SQL,比如SQL Server对应T-SQL,而Oracle对应PL/SQL;

SQL中存在DDL和DML;

SQL默认是基于包的数据库,即允许一个表中存在重复的元组;

SQL不区分大小写,包括关键字,表名,属性名等都是,但是字符串是大小写敏感的;比如:FROM 和 from是一样的,表明Table和tablE是一样的,属性名Attr和attR是一样的;

SQL中的比较运算符:需要注意的是两个运算符,=和<>分别表示相等和不等,不能使用!=来表示不等;

字符串连接运算符:+,即‘xiaz‘+‘dong‘;

字符串是用单引号括起来的;

 

DDL语句

 

(1)CREATE TABLE创建表模式;

(2)ALTER TABLE 修改表模式,比如:

            ALTER TABLE  t1 ADD age    int;

            ALTER TABLE  t1 DROP age;

(3)DROP TABLE 删除表模式,比如:

            DROP TABLE t1;

 

小知识点:如果想要为某个属性定义默认值,可以在属性声明后面加上 DEFAULT 值;

比如:age int DEFAULT 0;


基本数据类型


(1) INT;

(2)DECIMAL,指定小数点位数,DECIMAL(n,d) 表示一共n位有效数字,d个小数位;

(3)VARCHAR;变长的字符串,比如VARCHAR(5)表示最多长度为5的字符串;

(4)CHAR:固定长度的字符串,比如 CHAR(5)表示长度为5的字符串;

(5)DATE,DATE‘2010-02-03‘

(6)TIME:时间,由时、分、秒、微秒组成,TIME ‘14:00:20‘  表示 14时00分20秒;

(7)TIMESTAMP:由DATE和TIME组成;

(5)BOOLEAN:TRUE、FALSE、UNKNOWN;

(6)位串BIT;B‘0010‘


问:CHAR(3)和VARCHAR(3)有什么区别?


答:如下图所示:  虽然这两种数据类型的存储方式不同,但是如果char(3)类型的‘a‘和varchar(3)类型的‘a‘是相等的;

技术分享


注意:SQL中string是用单引号括起来的;


问:数据库和表的关系?


答:数据库中含有多个表,不能单纯的创建表;


问:PRIMARY KEY和UNIQUE有什么区别?


答:PRIMARY KEY 和UNIQUE都表示属性能够区别所有元组,但是PRIMARY KEY 不能存在NULL值,而UNIQUE允许NULL值;


问:类似PRIMARY KEY这种约束声明在哪?


答:可以声明在两个地方,

CREATE TABLE person(

         id               INT            PRIMARY KEY,    

         name        VARCHAR(20),

         ismale      boolean DEFAULT TRUE,

         birth          DATE,

         salary       DECIMAL(6,2)

);

或者

CREATE TABLE person(

         id               INT,    

         name        VARCHAR(20),

         ismale      boolean DEFAULT TRUE,

         birth          DATE,

         salary       DECIMAL(6,2),

  PRIMARY  KEY(id)

);

 

 

示例:

技术分享 

 

SQL查询


原始Person表有如下数据:

技术分享

规范:

SELECT attr1,attr2....attrn

FROM table1

WHERE predicate;

执行顺序:先FROM,再where后SELECT;

AS 可用来重命名属性或关系,比如:

SELECT id AS 学号,name AS 姓名,age AS 年龄,‘ECNU‘ AS 学校

FROM Person

 

运行结果如下所示:

 技术分享

 从上图中可以看出,列被重命名,而且还多加了一个“学校”的属性,因此在SELECT 中可以用AS重命名,而且还可以添加新的列;

 

字符串的操作


1.字符串的连接:+

2.字符串的额比较:<,>,<>,=,<=,>=;

3.字符串的模式匹配:%和 _ 分别表示任意多个字符和单个任意字符;比如‘xiazdong‘匹配‘xia%‘,‘xia_ _ _ _ _‘;

    S LIKE P:S匹配模式P时返回true;

    S NOT LIKE P: S不匹配模式P时返回true;

    字符串中两个连续的单引号表示一个单引号,比如‘a‘‘a‘表示字符串a‘a;

    我们可以通过ESCAPE ‘字符‘定义转义字符,比如ESCAPE ‘\‘就表名定义\为转义字符,即\%表示真实的%,而不是模式匹配的%;

            比如:name LIKE ‘xia\%\_%‘ ESCAPE ‘\‘表示\作为转义字符,并且名字是以xia%_开头的字符串;

举例:

如果Person表存在以下数据:

技术分享

 可以通过如下语句进行查找

SELECT * 

FROM Person

WHERE name LIKE ‘xia!%!_%‘  ESCAPE ‘!‘

就可以查找到此记录;

技术分享


SQL日期操作


SQL日期分为:

(1)DATE:由年月日组成,标准格式为‘yyyy-MM-dd‘;

(2)TIME:由小时、分钟、秒组成,标准格式为‘HH:mm:ss‘;

(3)TIMESTAMP:由DATE和TIME组合而成,标准的格式为‘yyyy-MM-dd HH:mm:ss‘;

日期实例:

DATE ‘2012-04-25‘ 表示 2012年4月25日;

TIME ‘14:30:00‘ 表示14点30分00秒;

TIMESTAMP ‘2012-04-25 14:30:00‘ 表示2012年4月25日 14点30分00秒;

日期操作是可以通过一般的比较运算符进行比较的;

 实例:

Person表结构如下所示:

CREATE TABLE `person` (

  ‘id‘ int(20),

  ‘name‘ varchar(20),

  ‘age‘ varchar(20),

  ‘birth‘ date,

  ‘meeting‘ time,

  ‘graduate‘ timestamp

  PRIMARY KEY (`id`)

);

插入语句为:

INSERT INTO Person VALUES (10,‘xiazdong-10‘,30,DATE‘1991-12-10‘ , TIME‘15:00:00‘,TIMESTAMP‘2012-02-02 14:20:00‘ );

 

NULL操作


1.NULL值和任意值算术运算都是空值;

2. NULL值和任意值比较运算都是UNKNOWN值;

比如:

a=null,b=5,则a+b为null;

a=null,b=5,则a>5为UNKNOWN;

判断是否为NULL的语句为a IS NULL 或 a IS NOT NULL

技术分享

 

问:SELECT * FROM Person WHERE age>0 OR age<=0是否会返回全部的元组呢?


答:不会。因为如果age的值为null,则age>0为UNKNOWN,age<=0为UNKNOWN,则不返回;


排序操作

 

ORDER BY 属性 [asc\desc];  

ORDER BY子句一定要放在所有语句的后面,即ORDER BY放在GROUP BY \HAVING等的后面;

举例:

对于Person表,如下语句:

SELECT * FROM PERSON

ORDER BY name,id DESC; 

 表明先以name值降序排列,当name值相等时然后以id值降序排列;

ORDER BY后面的属性可以是表达式,比如:

ORDER BY id+age,age+score;表示先以id+age的总数升序排序,如果id+age相等的话,则再以age+score升序排序;

 

不同表的属性重名问题


比如:

技术分享

在Person中Name和Course中Name属性不是一个含义,因此如果以下语句:

SELECT P.Name as stuName , C.Name as CourseName , C.teacherName

FROM Person as P,Course as C

WHERE P.name=C.stuName

为了区分不同表的name属性,我们需要在属性前面加上表的名称,并且还在SELECT 子句中重命名属性;


元组变量:像以上语句的Person as P ,其中P就是元组变量;


并、交、差运算


UNION || UNION ALL:对于集合操作的并;

INTERSECT|| INTERSECT ALL:集合的交;

EXCEPT || EXCEPT ALL:集合的差;

注意:

(1)比如UNION 后的关系需要去重复,因为是集合操作;而UNION ALL后的关系不需要去重复

(2)需要保证集合操作的关系属性名要相等,不能出现比如:SELECT NAME FROM PERSON union SELECT AGE FROM PERSON;的情况;


举例:


(SELECT name FROM person)

UNION 

(SELECT stuname AS name FROM course);


连接操作


1.交叉连接 CROSS JOIN


最基础的连接类似于直接用逗号分割,但是有一个区别:

A CROSS JOIN B :A不能等于B,即A和B不能是一张表;

A,B:没有以上限制;


2.自然连接 NATURAL JOIN


A NATURAL JOIN B:将A和B表中属性名相同的两列进行比较,如果值相等,则合并;

比如:

SELECT * FROM Person as A NATURAL JOIN Person as B;


3.θ连接 JOIN ON


A JOIN B ON predicate;

比如:

select * from person as B JOIN person as A ON A.id=B.id


4.外连接 OUTER JOIN


A [FULL | LEFT | RIGHT ] OUTER JOIN B;

A NATURAL LEFT OUTER JOIN B:在自然连接的基础上,保留A中不能匹配的元组,并将B中独有的属性处设为NULL;

举例:

技术分享

loan left outer join borrower on loan.loan_number = borrower.loan_number

技术分享

loan natural right outer join borrower

技术分享


子查询


子查询需要从里向外分析


1.子查询返回一个值


比如 select id from person where id =1 返回的只有一个值 1;

SELECT *  FROM Person WHERE id = ( select id from Person WHERE id=1) ;


2.子查询返回一个关系


SELECT * FROM Person WHERE id IN (SELECT id FROM person) ;


    2.1子查询位于WHERE中


            SELECT * FROM PERSON WHERE ID > ALL (SELECT id FROM person);


    2.2子查询位于FROM中


            SELECT * FROM Person,(SELECT id FROM Person) AS P2;


消除重复操作


DISTINCT;

此符号可以放在SELECT后,也可以放在聚集操作之中;

比如:

SELECT DISTINCT person

FROM Person;


分组操作


GROUP BY 和 HAVING;

HAVING子句是对聚集操作符进行限制;

WHERE子句是对一般的属性进行限制;


比如

SELECT age,avg(score)

FROM Person

GROUP BY age

HAVING avg(score)>90


聚集操作


聚集操作忽略null值,比如age有1,2,null,则avg(age)=1.5;

SUM(a):对a求和;

SUM(DISTINCT a):在对a求和之前先去除重复;

AVG(a)

AVG(DISTINCT a):在对a求平均之前先去除重复;

MIN(a)

MIN(DISTINCT a):在对a求最小值之前先去除重复;

MAX(a)

MAX(DISTINCT a):在对a求最大值之前先去除重复;

COUNT(a):计算a属性的个数(不包括null的元组);

COUNT(DISTINCE a):在对a计数之前先去除重复;

COUNT(*):元组的个数(包括null元组);


补充:Top用法


Top是用来规定返回的元组数目;比如一个数据库表中包含1万个元组,目的是要返回前5个,则可以使用Top;

SQL Server中语法如下:

SELECT TOP 5  column1,column2....    //规定返回前5个元组,并且列出column1...属性;

FROM Table

比如:


SELECT TOP 5 age

FROM Person

ORDER BY age ;  表示列出年纪最小的5个人;


MySQL中,语法如下:

SELECT *

FROM Table

LIMIT 5;

比如:


SELECT age

FROM Person

LIMIT 5

ORDER BY age;   //列出年纪最小的5个人;




其他符号


EXISTS R:如果关系R非空时返回true;

NOT EXISTS R:如果R空,则返回true;

t IN R:如果元组t属于R中的某个元组,则返回true;

t NOT IN R:如果元组t不属于R中的任何一个值,则返回true;

c > ALL R:c值要大于所有R(只有一个列)的记录;

c < ALL R:c值要小于所有R的记录;

c<>ALL R:c不等于R中全部的记录;

c > ANY R:c大于R中一个记录即可;

c = ANY R:c等于R中任意一个记录即可;



c<>ANY R 和 c<>ALL R 的区别


c<>ANY R 表示R中存在一个元组,不等于c,就是说只要R中存在一个元组不等于c,就返回true;

c<>ALL R表示元组c不在R中; 




SQL约束


主动元素:一个表达式或语句,编写后存储在数据库中,当某个特定的时间就会被执行;

    比如约束、触发器等都是主动元素,因为比如约束的语句存储在数据库中,当插入或更新数据时被调用进行检查;


为约束命名


我们可以形如:

CONSTRAINT [name] [约束]

比如:

CREATE TABLE Person(

    id    int    CONSTRAINT c1 PRIMARY KEY,

    name varchar(30)

);


键约束


PRIMARY KEY;

声明方式有两种:

(1)

CREATE TABLE Person(

    id    int    PRIMARY KEY,

    name varchar(30)

);

(2)

CREATE TABLE Person(

    id    int   ,

    name varchar(30),

    PRIMARY KEY (id)

);

外键约束


一个关系中的某个属性为外键,则此属性中的值必须在另一个关系中的主键或唯一性属性中出现;

(1)

CREATE TABLE Course(

    id    int   REFERENCES Person (id),  //引用Person表中的主键:id

    name varchar(30)

);

(2)

CREATE TABLE Course(

    id    int ,

    name varchar(30),

    FOREIGN KEY (id) REFERENCES Person (id)

);

更新时违反外键约束时的动作设置


默认为拒绝此违反约束的操作;

就拿上面的例子讲,如果Course表中有一个元组的id属性为1,对应Person表的id=1,如果Person表的id从1更新为2,则级联修改,Course表的id也随着修改;

如果Course表中有一个元组的id属性为1,对应Person表的id=1,如果Person表的id=1的元组被删除,则Course表的对应元组置空;

我们可以在声明时设置:

ON DELETE CASCADE:当Person的id删除时,Course对应的元组也会被删除;

ON DELETE SET NULL:当Person的id删除时,Course对应的元组会被设为null;

ON UPDATE SET NULL:当Person的id被更新,则Course对应的元组被设为null;

ON UPDATE CASCADE:当Person的id被更新,则Course对应的元组被更新;

(1)

CREATE TABLE Course(

    id    int   REFERENCES Person (id) 

                  ON DELETE SET NULL 

                  ON UPDATE CASCADE,  //引用Person表中的主键:id

    name varchar(30)

);

推迟约束检查


如果要执行一个事务,而事务执行到一半时可能会违反某个预先设定的约束,但是最后事务提交时,是不违反约束的,(因为默认是执行一条语句检查一次)则可以使用延迟检验;

这个功能MySQL没有提供延迟约束检查的机制;


每个约束都会带有一个设置,可以是deferrable或not deferrable,分别表示可延迟和不可延迟:

(1)可延迟的意思是每次都在事务提交时才检查约束;

(2)不可延迟的意思是每条语句检查约束;

NOT DEFERRABLE 表示不可延迟,如果在声明时设置为不可延迟,则约束都是不可延迟的;

DEFERRABLE INITIALLY IMMEDIATE 表示不可延迟,但是和上面的NOT DEFERRABLE不同,可以对约束进行更改,改为可延迟;

DEFERRABLE INITIALLY DEFERRED 表示可延迟约束;


问:NOT DEFERRABLE和DEFERRABLE INITIALLY IMMEDIATE 的区别


答:两者语义相同,但是区别在于一个可以对约束更改,一个不可以;

NOT DEFERRABLE只要一设定,就不能更改;

DEFERRABLE INITIALLY IMMEDIATE 可以对约束进行更改,改为可延迟,因此比较灵活,比如:

  SET CONSTRAINT aa DEFERRED;//将immediate改为deferred;

SET CONSTRAINT aa IMMEDIATE;//将deferred改为immediate;

举例:


(1)

CREATE TABLE Course(

    id    int   REFERENCES Person (id) 

                   DEFERRABLE INITIALLY DEFERRED,   //延迟约束检查;

    name varchar(30)

);

(2)

SET CONSTRAINT [name] DEFERRED;

 也可以将一个约束设置为延迟的;


非空约束


CREATE TABLE Course(

    id    int   REFERENCES Person (id) NOT NULL, // id属性不为空

    name varchar(30) 

);


CHECK约束


CHECK约束是形如:

CHECK (age>30) 表示age属性药大于30;

CHECK约束括号中的语句可以是任何WHERE子句中的语句;

(1)基于元组的CHECK约束

        当CHECK约束涉及此关系中的多个属性时,则使用基于元组的CHECK约束;

        当元组被插入或更新时检查;

(2)基于属性的CHECK约束

        此CHECK约束只属于一个属性,当属性被插入或更新时检查;

注意:

(1)CHECK对于旧的数据是不检查的,比如在设置CHECK约束前已经插入了违反CHECK约束的数据,则CHECK约束是检查不出的;

(2)基于元组的约束检查次数比基于属性的约束更多;


CREATE TABLE Person(

    id    int   CHECK ( id > 0),     //基于属性的约束

    gender varchar(1)  CHECK(gender in (‘F‘,‘M‘)),

    name varchar(30),

    PRIMARY KEY (id),

);

CREATE TABLE Person(

    id    int  ,  

    gender varchar(1),

    name varchar(30),

    PRIMARY KEY (id),

    CHECK ( id > 0 AND CHECK(gender in (‘F‘,‘M‘)))  //基于元组的约束

);

人气教程排行