时间:2021-07-01 10:21:17 帮助过:4人阅读
主属性:包含于候选码的一个属性;比如如果候选码为AB,则主属性可以是A,B,只要包含于候选码的单个属性即可;
SQL是专门用于关系模式的查询语言,他是高度抽象化的;
SQL的版本有最早的 ANSI SQL-->SQL92-->SQL99-->SQL2003
现在的各大商业数据库都是有各自版本的SQL,比如SQL Server对应T-SQL,而Oracle对应PL/SQL;
SQL中存在DDL和DML;
SQL默认是基于包的数据库,即允许一个表中存在重复的元组;
SQL不区分大小写,包括关键字,表名,属性名等都是,但是字符串是大小写敏感的;比如:FROM 和 from是一样的,表明Table和tablE是一样的,属性名Attr和attR是一样的;
SQL中的比较运算符:需要注意的是两个运算符,=和<>分别表示相等和不等,不能使用!=来表示不等;
字符串连接运算符:+,即‘xiaz‘+‘dong‘;
字符串是用单引号括起来的;
(1)CREATE TABLE创建表模式;
(2)ALTER TABLE 修改表模式,比如:
ALTER TABLE t1 ADD age int;
ALTER TABLE t1 DROP age;
(3)DROP TABLE 删除表模式,比如:
DROP TABLE t1;
小知识点:如果想要为某个属性定义默认值,可以在属性声明后面加上 DEFAULT 值;
比如:age int DEFAULT 0;
(1) INT;
(2)DECIMAL,指定小数点位数,DECIMAL(n,d) 表示一共n位有效数字,d个小数位;
(3)VARCHAR;变长的字符串,比如VARCHAR(5)表示最多长度为5的字符串;
(4)CHAR:固定长度的字符串,比如 CHAR(5)表示长度为5的字符串;
(5)DATE,DATE‘2010-02-03‘
(6)TIME:时间,由时、分、秒、微秒组成,TIME ‘14:00:20‘ 表示 14时00分20秒;
(7)TIMESTAMP:由DATE和TIME组成;
(5)BOOLEAN:TRUE、FALSE、UNKNOWN;
(6)位串BIT;B‘0010‘
答:如下图所示: 虽然这两种数据类型的存储方式不同,但是如果char(3)类型的‘a‘和varchar(3)类型的‘a‘是相等的;
注意:SQL中string是用单引号括起来的;
答:数据库中含有多个表,不能单纯的创建表;
答:PRIMARY KEY 和UNIQUE都表示属性能够区别所有元组,但是PRIMARY KEY 不能存在NULL值,而UNIQUE允许NULL值;
答:可以声明在两个地方,
CREATE TABLE person(
id INT PRIMARY KEY,
name VARCHAR(20),
ismale boolean DEFAULT TRUE,
birth DATE,
salary DECIMAL(6,2)
);
或者
CREATE TABLE person(
id INT,
name VARCHAR(20),
ismale boolean DEFAULT TRUE,
birth DATE,
salary DECIMAL(6,2),
PRIMARY KEY(id)
);
示例:
原始Person表有如下数据:
规范:
SELECT attr1,attr2....attrn
FROM table1
WHERE predicate;
执行顺序:先FROM,再where后SELECT;
AS 可用来重命名属性或关系,比如:
SELECT id AS 学号,name AS 姓名,age AS 年龄,‘ECNU‘ AS 学校 FROM Person |
运行结果如下所示:
从上图中可以看出,列被重命名,而且还多加了一个“学校”的属性,因此在SELECT 中可以用AS重命名,而且还可以添加新的列;
字符串的操作
1.字符串的连接:+
2.字符串的额比较:<,>,<>,=,<=,>=;
3.字符串的模式匹配:%和 _ 分别表示任意多个字符和单个任意字符;比如‘xiazdong‘匹配‘xia%‘,‘xia_ _ _ _ _‘;
S LIKE P:S匹配模式P时返回true;
S NOT LIKE P: S不匹配模式P时返回true;
字符串中两个连续的单引号表示一个单引号,比如‘a‘‘a‘表示字符串a‘a;
我们可以通过ESCAPE ‘字符‘定义转义字符,比如ESCAPE ‘\‘就表名定义\为转义字符,即\%表示真实的%,而不是模式匹配的%;
比如:name LIKE ‘xia\%\_%‘ ESCAPE ‘\‘表示\作为转义字符,并且名字是以xia%_开头的字符串;
举例:
如果Person表存在以下数据:
可以通过如下语句进行查找
SELECT *
FROM Person
WHERE name LIKE ‘xia!%!_%‘ ESCAPE ‘!‘
就可以查找到此记录;
SQL日期操作
SQL日期分为:
(1)DATE:由年月日组成,标准格式为‘yyyy-MM-dd‘;
(2)TIME:由小时、分钟、秒组成,标准格式为‘HH:mm:ss‘;
(3)TIMESTAMP:由DATE和TIME组合而成,标准的格式为‘yyyy-MM-dd HH:mm:ss‘;
日期实例:
DATE ‘2012-04-25‘ 表示 2012年4月25日;
TIME ‘14:30:00‘ 表示14点30分00秒;
TIMESTAMP ‘2012-04-25 14:30:00‘ 表示2012年4月25日 14点30分00秒;
日期操作是可以通过一般的比较运算符进行比较的;
实例:
Person表结构如下所示:
CREATE TABLE `person` (
‘id‘ int(20),
‘name‘ varchar(20),
‘age‘ varchar(20),
‘birth‘ date,
‘meeting‘ time,
‘graduate‘ timestamp
PRIMARY KEY (`id`)
);
插入语句为:
INSERT INTO Person VALUES (10,‘xiazdong-10‘,30,DATE‘1991-12-10‘ , TIME‘15:00:00‘,TIMESTAMP‘2012-02-02 14:20:00‘ );
NULL操作
1.NULL值和任意值算术运算都是空值;
2. NULL值和任意值比较运算都是UNKNOWN值;
比如:
a=null,b=5,则a+b为null;
a=null,b=5,则a>5为UNKNOWN;
判断是否为NULL的语句为a IS NULL 或 a IS NOT NULL;
问:SELECT * FROM Person WHERE age>0 OR age<=0是否会返回全部的元组呢?
答:不会。因为如果age的值为null,则age>0为UNKNOWN,age<=0为UNKNOWN,则不返回;
排序操作
ORDER BY 属性 [asc\desc];
ORDER BY子句一定要放在所有语句的后面,即ORDER BY放在GROUP BY \HAVING等的后面;
举例:
对于Person表,如下语句:
SELECT * FROM PERSON
ORDER BY name,id DESC;
表明先以name值降序排列,当name值相等时然后以id值降序排列;
ORDER BY后面的属性可以是表达式,比如:
ORDER BY id+age,age+score;表示先以id+age的总数升序排序,如果id+age相等的话,则再以age+score升序排序;
不同表的属性重名问题
比如:
在Person中Name和Course中Name属性不是一个含义,因此如果以下语句:
SELECT P.Name as stuName , C.Name as CourseName , C.teacherName
FROM Person as P,Course as C
WHERE P.name=C.stuName
为了区分不同表的name属性,我们需要在属性前面加上表的名称,并且还在SELECT 子句中重命名属性;
元组变量:像以上语句的Person as P ,其中P就是元组变量;
并、交、差运算
UNION || UNION ALL:对于集合操作的并;
INTERSECT|| INTERSECT ALL:集合的交;
EXCEPT || EXCEPT ALL:集合的差;
注意:
(1)比如UNION 后的关系需要去重复,因为是集合操作;而UNION ALL后的关系不需要去重复;
(2)需要保证集合操作的关系属性名要相等,不能出现比如:SELECT NAME FROM PERSON union SELECT AGE FROM PERSON;的情况;
举例:
(SELECT name FROM person)
UNION
(SELECT stuname AS name FROM course);
连接操作
1.交叉连接 CROSS JOIN
最基础的连接类似于直接用逗号分割,但是有一个区别:
A CROSS JOIN B :A不能等于B,即A和B不能是一张表;
A,B:没有以上限制;
2.自然连接 NATURAL JOIN
A NATURAL JOIN B:将A和B表中属性名相同的两列进行比较,如果值相等,则合并;
比如:
SELECT * FROM Person as A NATURAL JOIN Person as B;
3.θ连接 JOIN ON
A JOIN B ON predicate;
比如:
select * from person as B JOIN person as A ON A.id=B.id
4.外连接 OUTER JOIN
A [FULL | LEFT | RIGHT ] OUTER JOIN B;
A NATURAL LEFT OUTER JOIN B:在自然连接的基础上,保留A中不能匹配的元组,并将B中独有的属性处设为NULL;
举例:
loan left outer join borrower on loan.loan_number = borrower.loan_number loan natural right outer join borrower
子查询
子查询需要从里向外分析
1.子查询返回一个值
比如 select id from person where id =1 返回的只有一个值 1;
SELECT * FROM Person WHERE id = ( select id from Person WHERE id=1) ;
2.子查询返回一个关系
SELECT * FROM Person WHERE id IN (SELECT id FROM person) ;
2.1子查询位于WHERE中
SELECT * FROM PERSON WHERE ID > ALL (SELECT id FROM person);
2.2子查询位于FROM中
SELECT * FROM Person,(SELECT id FROM Person) AS P2;
消除重复操作
DISTINCT;
此符号可以放在SELECT后,也可以放在聚集操作之中;
比如:
SELECT DISTINCT person
FROM Person;
分组操作
GROUP BY 和 HAVING;
HAVING子句是对聚集操作符进行限制;
WHERE子句是对一般的属性进行限制;
比如
SELECT age,avg(score)
FROM Person
GROUP BY age
HAVING avg(score)>90
聚集操作
聚集操作忽略null值,比如age有1,2,null,则avg(age)=1.5;
SUM(a):对a求和;
SUM(DISTINCT a):在对a求和之前先去除重复;
AVG(a)
AVG(DISTINCT a):在对a求平均之前先去除重复;
MIN(a)
MIN(DISTINCT a):在对a求最小值之前先去除重复;
MAX(a)
MAX(DISTINCT a):在对a求最大值之前先去除重复;
COUNT(a):计算a属性的个数(不包括null的元组);
COUNT(DISTINCE a):在对a计数之前先去除重复;
COUNT(*):元组的个数(包括null元组);
补充:Top用法
Top是用来规定返回的元组数目;比如一个数据库表中包含1万个元组,目的是要返回前5个,则可以使用Top;
在SQL Server中语法如下:
SELECT TOP 5 column1,column2.... //规定返回前5个元组,并且列出column1...属性;
FROM Table
比如:
SELECT TOP 5 age
FROM Person
ORDER BY age ; 表示列出年纪最小的5个人;
在MySQL中,语法如下:
SELECT *
FROM Table
LIMIT 5;
比如:
SELECT age
FROM Person
LIMIT 5
ORDER BY age; //列出年纪最小的5个人;
其他符号
EXISTS R:如果关系R非空时返回true;
NOT EXISTS R:如果R空,则返回true;
t IN R:如果元组t属于R中的某个元组,则返回true;
t NOT IN R:如果元组t不属于R中的任何一个值,则返回true;
c > ALL R:c值要大于所有R(只有一个列)的记录;
c < ALL R:c值要小于所有R的记录;
c<>ALL R:c不等于R中全部的记录;
c > ANY R:c大于R中一个记录即可;
c = ANY R:c等于R中任意一个记录即可;
c<>ANY R 和 c<>ALL R 的区别
c<>ANY R 表示R中存在一个元组,不等于c,就是说只要R中存在一个元组不等于c,就返回true;
c<>ALL R表示元组c不在R中;
SQL约束
主动元素:一个表达式或语句,编写后存储在数据库中,当某个特定的时间就会被执行;
比如约束、触发器等都是主动元素,因为比如约束的语句存储在数据库中,当插入或更新数据时被调用进行检查;
为约束命名
我们可以形如:
CONSTRAINT [name] [约束]
比如:
CREATE TABLE Person(
id int CONSTRAINT c1 PRIMARY KEY,
name varchar(30)
);
键约束
PRIMARY KEY;
声明方式有两种:
(1)
CREATE TABLE Person(
id int PRIMARY KEY,
name varchar(30)
);
(2)
CREATE TABLE Person(
id int ,
name varchar(30),
PRIMARY KEY (id)
);
外键约束
一个关系中的某个属性为外键,则此属性中的值必须在另一个关系中的主键或唯一性属性中出现;
(1)
CREATE TABLE Course(
id int REFERENCES Person (id), //引用Person表中的主键:id
name varchar(30)
);
(2)
CREATE TABLE Course(
id int ,
name varchar(30),
FOREIGN KEY (id) REFERENCES Person (id)
);
更新时违反外键约束时的动作设置
默认为拒绝此违反约束的操作;
就拿上面的例子讲,如果Course表中有一个元组的id属性为1,对应Person表的id=1,如果Person表的id从1更新为2,则级联修改,Course表的id也随着修改;
如果Course表中有一个元组的id属性为1,对应Person表的id=1,如果Person表的id=1的元组被删除,则Course表的对应元组置空;
我们可以在声明时设置:
ON DELETE CASCADE:当Person的id删除时,Course对应的元组也会被删除;
ON DELETE SET NULL:当Person的id删除时,Course对应的元组会被设为null;
ON UPDATE SET NULL:当Person的id被更新,则Course对应的元组被设为null;
ON UPDATE CASCADE:当Person的id被更新,则Course对应的元组被更新;
(1)
CREATE TABLE Course(
id int REFERENCES Person (id)
ON DELETE SET NULL
ON UPDATE CASCADE, //引用Person表中的主键:id
name varchar(30)
);
推迟约束检查
如果要执行一个事务,而事务执行到一半时可能会违反某个预先设定的约束,但是最后事务提交时,是不违反约束的,(因为默认是执行一条语句检查一次)则可以使用延迟检验;
这个功能MySQL没有提供延迟约束检查的机制;
每个约束都会带有一个设置,可以是deferrable或not deferrable,分别表示可延迟和不可延迟:
(1)可延迟的意思是每次都在事务提交时才检查约束;
(2)不可延迟的意思是每条语句检查约束;
NOT DEFERRABLE 表示不可延迟,如果在声明时设置为不可延迟,则约束都是不可延迟的;
DEFERRABLE INITIALLY IMMEDIATE 表示不可延迟,但是和上面的NOT DEFERRABLE不同,可以对约束进行更改,改为可延迟;
DEFERRABLE INITIALLY DEFERRED 表示可延迟约束;
问:NOT DEFERRABLE和DEFERRABLE INITIALLY IMMEDIATE 的区别
答:两者语义相同,但是区别在于一个可以对约束更改,一个不可以;
NOT DEFERRABLE只要一设定,就不能更改;
DEFERRABLE INITIALLY IMMEDIATE 可以对约束进行更改,改为可延迟,因此比较灵活,比如:
SET CONSTRAINT aa DEFERRED;//将immediate改为deferred;
SET CONSTRAINT aa IMMEDIATE;//将deferred改为immediate;
举例:
(1)
CREATE TABLE Course(
id int REFERENCES Person (id)
DEFERRABLE INITIALLY DEFERRED, //延迟约束检查;
name varchar(30)
);
(2)
SET CONSTRAINT [name] DEFERRED;
也可以将一个约束设置为延迟的;
非空约束
CREATE TABLE Course(
id int REFERENCES Person (id) NOT NULL, // id属性不为空
name varchar(30)
);
CHECK约束
CHECK约束是形如:
CHECK (age>30) 表示age属性药大于30;
CHECK约束括号中的语句可以是任何WHERE子句中的语句;
(1)基于元组的CHECK约束
当CHECK约束涉及此关系中的多个属性时,则使用基于元组的CHECK约束;
当元组被插入或更新时检查;
(2)基于属性的CHECK约束
此CHECK约束只属于一个属性,当属性被插入或更新时检查;
注意:
(1)CHECK对于旧的数据是不检查的,比如在设置CHECK约束前已经插入了违反CHECK约束的数据,则CHECK约束是检查不出的;
(2)基于元组的约束检查次数比基于属性的约束更多;
CREATE TABLE Person(
id int CHECK ( id > 0), //基于属性的约束
gender varchar(1) CHECK(gender in (‘F‘,‘M‘)),
name varchar(30),
PRIMARY KEY (id),
);
CREATE TABLE Person(
id int ,
gender varchar(1),
name varchar(30),
PRIMARY KEY (id),
CHECK ( id > 0 AND CHECK(gender in (‘F‘,‘M‘))) //基于元组的约束
);