当前位置:Gxlcms > 数据库问题 > 数据库相关概念

数据库相关概念

时间:2021-07-01 10:21:17 帮助过:10人阅读

一、相关概念1. SQL:结构化查询语言的简称,是关系数据库的标准语言。SQL 是一种通用的、功能极强的关系数据库语言, 是对关系数据存取的标准接口, 也是不同数据库系统之间互操作的基础。集数据查询、数据操作、数据定义、和数据控制功能于一体。2. 数据定义:数据定义功能包括模式定义、表定义、视图和索引的定义。3. 嵌套查询:指将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询。二、重要知识点1. SQL 数据定义语句的操作对象有:模式、表、视图和索引。2. SQL 数据定义语句的命令动词是:CREATE、DROP 和 ALTER。3. RDBMS 中索引一般采用 B+树或 HASH 来实现。4. 索引可以分为唯一索引、非唯一索引和聚簇索引三种类型技术分享 6.SQL 创建表语句的一般格式为CREATE TABLE <表名>( <列名> <数据类型>[ <列级完整性约束> ][,<列名> <数据类型>[ <列级完整性约束>] ] …[,<表级完整性约束> ] ) ;其中<数据类型>可以是数据库系统支持的各种数据类型,包括长度和精度。列级完整性约束为针对单个列(本列)的完整性约束, 包括 PRIMARY KEY、 REFERENCES 表名(列名)、UNIQUE、NOT NULL 等。表级完整性约束可以是基于表中多列的约束,包括 PRIMARY KEY ( 列名列表) 、FOREIGN KEY REFERENCES 表名(列名) 等。7. SQL 创建索引语句的一般格式为CREATE [UNIQUE] [CLUSTER] INDEX <索引名>ON <表名> (<列名列表> ) ;其中 UNIQUE:表示创建唯一索引,缺省为非唯一索引;CLUSTER:表示创建聚簇索引,缺省为非聚簇索引;<列名列表>:一个或逗号分隔的多个列名,每个列名后可跟 ASC 或 DESC,表示升/降序,缺省为升序。多列时则按为多级排序。8. SQL 查询语句的一般格式为SELECT [ALL|DISTINCT] <算术表达式列表> FROM <表名或视图名列表>[ WHERE <条件表达式 1> ][ GROUP BY <属性列表 1> [ HAVING <条件表达式 2 > ] ][ ORDER BY <属性列表 2> [ ASC|DESC ] ] ;其中ALL/DISTINCT: 缺省为 ALL, 即列出所有查询结果记录, 包括重复记录。 DISTINCT 则对重复记录只列出一条。算术表达式列表:一个或多个逗号分隔的算术表达式,表达式由常量(包括数字和字符串)、列名、函数和算术运算符构成。每个表达式后还可跟别名。也可用 *代表查询表中的所有列。<表名或视图名列表>: 一个或多个逗号分隔的表或视图名。 表或视图名后可跟别名。条件表达式 1:包含关系或逻辑运算符的表达式,代表查询条件。条件表达式 2:包含关系或逻辑运算符的表达式,代表分组条件。<属性列表 1>:一个或逗号分隔的多个列名。<属性列表 2>: 一个或逗号分隔的多个列名, 每个列名后可跟 ASC 或 DESC, 表示升/降序,缺省为升序。关于 SQL 语句的知识这里先作如上简略介绍,具体写法下次将专门拿出一篇来叙述。第四节一、相关概念和知识1.触发器是用户定义在基本表上的一类由事件驱动的特殊过程。由服务器自动激活,能执行更为复杂的检查和操作,具有更精细和更强大的数据控制能力。使用 CREATE TRIGGER 命令建立触发器。2.计算机系统存在技术安全、管理安全和政策法律三类安全性问题。3. TCSEC/TDI 标准由安全策略、责任、保证和文档四个方面内容构成。4. 常用存取控制方法包括自主存取控制(DAC)和强制存取控制(MAC)两种。5. 自主存取控制(DAC)的 SQL 语句包括 GRANT 和 REVOKE 两个。 用户权限由数据对象和操作类型两部分构成。技术分享 6. 常见 SQL 自主权限控制命令和例子。1) 把对 Student 和 Course 表的全部权限授予所有用户。GRANT ALL PRIVILIGES ON TABLE Student,Course TO PUBLIC ;2) 把对 Student 表的查询权和姓名修改权授予用户 U4。GRANT SELECT,UPDATE(Sname) ON TABLE Student TO U4 ;3) 把对 SC 表的插入权限授予 U5 用户,并允许他传播该权限。GRANT INSERT ON TABLE SC TO U5 WITH GRANT OPTION ;4) 把用户 U5 对 SC 表的 INSERT 权限收回,同时收回被他传播出去的授权。REVOKE INSERT ON TABLE SC FROM U5 CASCADE ;5) 创建一个角色 R1,并使其对 Student 表具有数据查询和更新权限。CREATE ROLE R1;GRANT SELECT,UPDATE ON TABLE Student TO R1;6) 对修改 Student 表结构的操作进行审计。一、相关概念和知识点1.数据依赖:反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。2. 规范化理论:是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。3. 函数依赖:简单地说,对于关系模式的两个属性子集 X 和 Y,若 X 的任一取值能唯一确定 Y 的值,则称 Y 函数依赖于 X,记作 X→Y。4. 非平凡函数依赖:对于关系模式的两个属性子集 X 和 Y,如果 X→Y,但 Y!?X,则称 X→Y 为非平凡函数依赖;如果 X→Y,但 Y?X,则称 X→Y 为非平凡函数依赖。5. 完全函数依赖:对于关系模式的两个属性子集 X 和 Y,如果 X→Y,并且对于 X 的任何一个真子集 X‘,都没有 X‘→Y,则称 Y 对 X 完全函数依赖。6. 范式:指符合某一种级别的关系模式的集合。在设计关系数据库时,根据满足依赖关系要求的不同定义为不同的范式。7. 规范化:指将一个低一级范式的关系模式,通过模式分解转换为若干个高一级范式的关系模式的集合的过程。8. 1NF:若关系模式的所有属性都是不可分的基本数据项,则该关系模式属于 1NF。9. 2NF:1NF 关系模式如果同时满足每一个非主属性完全函数依赖于码,则该关系模式属于 2NF。10. 3NF:若关系模式的每一个非主属性既不部分依赖于码也不传递依赖于码,则该关系模式属于 3NF。11. BCNF:若一个关系模式的每一个决定因素都包含码,则该关系模式属于 BCNF。12. 数据库设计:是指对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。13. 数据库设计的 6 个基本步骤:需求分析,概念结构设计,逻辑结构设计,物理结构设计,数据库实施,数据库运行和维护。14. 概念结构设计:指将需求分析得到的用户需求抽象为信息结构即概念模型的过程。也就是通过对用户需求进行综合、归纳与抽象,形成一个独立于具体 DBMS 的概念模型。15. 逻辑结构设计:将概念结构模型(基本 E-R 图)转换为某个 DBMS 产品所支持的数据模型相符合的逻辑结构,并对其进行优化。16. 物理结构设计:指为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程。包括设计数据库的存储结构与存取方法。17. 抽象:指对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。18. 数据库设计必须遵循结构设计和行为设计相结合的原则。19. 数据字典主要包括数据项、数据结构、数据流、数据存储和处理过程五个部分。20. 三种常用抽象方法是分类、聚集和概括。21. 局部 E-R 图之间的冲突主要表现在属性冲突、命名冲突和结构冲突三个方面。22. 数据库常用的存取方法包括索引方法、聚簇方法和 HASH 方法三种。23. 确定数据存放位置和存储结构需要考虑的因素主要有: 存取时间、 存储空间利用率和维护代价等。二、细说数据库三范式2.1 第一范式(1NF)无重复的列第一范式(1NF)中数据库表的每一列都是不可分割的基本数据项同一列中不能有多个值即实体中的某个属性不能有多个值或者不能有重复的属性。简而言之,第一范式就是无重复的列。在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。2.2 第二范式(2NF)属性完全依赖于主键[消除部分子函数依赖]满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是属性完全依赖于主键。2.3 第三范式(3NF)属性不依赖于其它非主属性[消除传递依赖]满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。2.4 具体实例剖析下面列举一个学校的学生系统的实例,以示几个范式的应用。在设计数据库表结构之前,我们先确定一下要设计的内容包括那些。学号、学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话等信息。为了简单我们暂时只考虑这些字段信息。我们对于这些信息,说关心的问题有如下几个方面。1)学生有那些基本信息2)学生选了那些课,成绩是什么3)每个课的学分是多少4)学生属于那个系,系的基本信息是什么。首先第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据库管理系统(DBMS)中,不允许你把数据库表的一列再分成二列或多列,因此做出的都是符合第一范式的数据库。我们再考虑第二范式,把所有这些信息放到一个表中(学号,学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话)下面存在如下的依赖关系。1)(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话)2) (课程名称) → (学分)3)(学号,课程)→ (学科成绩)根据依赖关系我们可以把选课关系表 SelectCourse 改为如下三个表:学生:Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话);课程:Course(课程名称, 学分);选课关系:SelectCourse(学号, 课程名称, 成绩)。事实上,对照第二范式的要求,这就是满足第二范式的数据库表,若不满足第二范式,会产生如下问题数据冗余: 同一门课程由 n 个学生选修,"学分"就重复 n-1 次;同一个学生选修了 m 门课程,姓名和年龄就重复了 m-1 次。更新异常: 1)若调整了某门课程的学分,数据表中所有行的"学分"值都要更新,否则会出现同一门课程学分不同的情况。2)假设要开设一门新的课程,暂时还没有人选修。这样,由于还没有"学号" 关键字,课程名称和学分也无法记录入数据库。删除异常 : 假设一批学生已经完成课程的选修,这些选修记录就应该从数据库表中删除。但是,与此同时,课程名称和学分信息也被删除了。很显然,这也会导致插入异常。我们再考虑如何将其改成满足第三范式的数据库表,接着看上面的学生表 Student(学号,姓名, 年龄,性别,系别,系办地址、系办电话),关键字为单一关键字"学号",因为存在如下决定关系:(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话)但是还存在下面的决定关系(学号) → (所在学院)→(学院地点, 学院电话)即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。它也会存在数据冗余、更新异常、插入异常和删除异常的情况(这里就不具体分析了,参照第二范式中的分析)。根据第三范式把学生关系表分为如下两个表就可以满足第三范式了:学生:(学号, 姓名, 年龄, 性别,系别);系别:(系别, 系办地址、系办电话)。这一部分是 C/C++程序员在面试的时候会被问到的一些题目的汇总。来源于基本笔试面试书籍,可能有一部分题比较老,但是这也算是基础

数据库相关概念

标签:面向   通过   如何   一对一   tab   des   foreign   获取   时间   

人气教程排行