当前位置:Gxlcms > 数据库问题 > 数据库表结构设计方法及原则

数据库表结构设计方法及原则

时间:2021-07-01 10:21:17 帮助过:22人阅读

//第四范式我们遵守的并不多吧。
//例如:
//VAS_WP_CONFIG.config_name字段的值包括:adv(广告主题)/glare(炫彩滚动主题)/theme_simple(普通主题)/theme_cartoon(动画主题)/ theme_none(不显示背景主题)
//cate_background(类目背景)/video(公司视频)/board_cartoon(动画招牌)/board_simple(普通招牌)等。
//如果遵守第四范式,则需要新增一张VAS_WP_CONFIG_NAME表,存储配置名称枚举值,而VAS_WP_CONFIG.config_name字段改为VAS_WP_CONFIG.config_name_id。
//这样做更利于扩展,不会因为每个人的理解不一致而向VAS_WP_CONFIG.config_name字段里设置乱七八糟的值,但是这样需要维护更多的小表,造成数据值表的数量膨胀,DBA可能会觉得管理上有更多的困难。
//我们采用潜规则约定、java枚举类等其它方式来进行保证。但有时候效果并不是很好,经常发现旧数据库表中枚举字段的值五花八门,不全是约定的。
技术分享

  7.在经过分析后确认所有的表都满足二、三、四范式的情况下,表和表之间的关联尽量采用弱关联以便于对表字段和表结构的调整和重构。并且,我认为数据库中的表是用来持久化一个对象实例在特定时间及特定条件下的状态的,只是一个存储介质,所以,表和表之间也不应用强关联来表述业务(数据间的一致性),这一职责应由系统的逻辑层来保证,这种方式也确保了系统对于不正确数据(脏数据)的兼容性。当然,从整个系统的角度来说我们还是要尽最大努力确保系统不会产生脏数据,单从另一个角度来说,脏数据的产生在一定程度上也是不可避免的,我们也要保证系统对这种情况的容错性。这是一个折中的方案。

  8.应针对所有表的主键和外键建立索引,有针对性的(针对一些大数据量和常用检索方式)建立组合属性的索引,提高检索效率。虽然建立索引会消耗部分系统资源,但比较起在检索时搜索整张表中的数据尤其时表中的数据量较大时所带来的性能影响,以及无索引时的排序操作所带来的性能影响,这种方式仍然是值得提倡的。

//索引目前都是DBA根据具体的SQL来创建的,不过开发写SQL时,也应该适当考虑一下字段的索引。

  9.尽量少采用存储过程,目前已经有很多技术可以替代存储过程的功能如"对象/关系映射"等,将数据一致性的保证放在数据库中,无论对于版本控制、开发和部署、以及数据库的迁移都会带来很大的影响。但不可否认,存储过程具有性能上的优势,所以,当系统可使用的硬件不会得到提升而性能又是非常重要的质量属性时,可经过平衡考虑选用存储过程。

//目前都是杜绝使用存储过程的,我觉得用起来比较方便,对于我们来说,主要原因是会给DBA带来管理方面的麻烦,
//因为时间一长,存储过程的逻辑和使用场景,往往没人能了解,容易产生更多问题

  10.当处理表间的关联约束所付出的代价(常常是使用性上的代价)超过了保证不会出现修改、删除、更改异常所付出的代价,并且数据冗余也不是主要的问题时,表设计可以不符合四个范式。四个范式确保了不会出现异常,但也可能由此导致过于纯洁的设计,使得表结构难于使用,所以在设计时需要进行综合判断,但首先确保符合四个范式,然后再进行精化修正是刚刚进入数据库设计领域时可以采用的最好办法。

  11.设计出的表要具有较好的使用性,主要体现在查询时是否需要关联多张表且还需使用复杂的SQL技巧。我感觉遵守的范式越多,就越使SQL复杂,具体情况具体分析。设计出的表要尽可能减少数据冗余,确保数据的准确性,有效的控制冗余有助于提高数据库的性能

  因此,考虑了以上条件之后,表设计约定规则如下:

技术分享
//规则1:表必须要有主键。
//规则2:一个字段只表示一个含义。
//规则3:总是包含两个日期字段:gmt_create(创建日期),gmt_modified(修改日期),且这两个字段不应该包含有额外的业务逻辑。
//规则4:MySQL中,gmt_create、gmt_modified使用DATETIME类型。
//规则5:禁止使用复杂数据类型(数组,自定义类型等)。
//规则6: MySQL中,附属表拆分后,附属表id与主表id保持一致。不允许在附属表新增主键字段。
//规则7: MySQL中,存在过期概念的表,在其设计之初就必须有过期机制,且有明确的过期时间。过期数据必须迁移至历史表中。
//规则8: MySQL中,不再使用的表,必须通知DBA予以更名归档。
//规则9: MySQL中,线上表中若有不再使用的字段,为保证数据完整,禁止删除。
//规则10: MySQL中,禁止使用OCI驱动,全部使用THI驱动。
技术分享

关于MySQL的部分学习笔记总结:

一、事务跟存储引擎

  1.四种事务隔离级别:read uncommited, read commited(大多数db默认的),repeatable read(mysql默认), seriazable。

  2.mysql是默认的auto commited, 也就是说每次查询默认都是自动提交的(show variables like ‘autocommited‘)。mysql可以通过set transaction isolatioin level命令来设置隔离级别,例如:set session transaction isolation level read commited。

  3.mysql中像innodb采用mvcc(多版本并发控制)来处理并发。mvcc只工作在read commited,repeatable read这两种事务隔离级别上。read uncommited隔离级别不兼容mvcc是因为在该级别得下的查询,不读取符合当前事务版本的数据行,而是最新版本的数据行。seriazable隔离级别不兼容MVCC,因为该级别下的读操作会对每个返回行进行加锁。

  4.选择存储引擎,并发选用myisam,事务选择innodb,myisam比innodb更容易出错,出错了恢复的时间也比较长。只有myisam支持全文检索。

  5.把表从一种存储引擎转到另一种引擎:

//  1.    alter table mytable engine=falcon;  操作费时,可能会占用服务器的所有i/o处理能力。
//  2.    create table innodb_table like myisam_table;
//        alter table innodb_table engine=innodb;
//        insert into innodb_table select * from myisam_table;

二、数据类型

  1.尽可能的要把field定义为Not NULL, mysql比较难优化使用了可空列的查询,它会使索引,索引统计更加复杂。可空列需要更多的存储空间,还需要mysql内部进行特殊处理,当可空列被索引时,每条记录都需要一个格外的字节。 即使要在表中存储"没有值"的字段,考虑使用0,特殊字段或者空字符串来代替。

  2.datetime与timestamp能保存同样的数据:精确度为秒,但是timestamp使用的空间只有datetime的一半,还能保存时区,拥有特殊的自动更新能力。但是timestamp保存的时间范围要比datetime要小得多。mysql能存储的最细的时间粒度为秒

  3.mysql支持很多种别名,如bool,integer,nummeric.

  4.float与double类型支持使用标准的浮点运算进行近似计算。 Decimal类型保存精确的小数,在>=mysql5.0,mysql服务器自身进行了decimal的运算,因为CPU不支持直接对它进行运算,所以慢一点。

  5.mysql会把text与blob类型的列当成有实体的对象来进行保存。他们有各自的数据类型家族(tinytext,smalltext,text,mediumtext,longtext; blob类似); mysql对blob与text列排序方式和其他类型有所不同,它不会按照字符串的完整长度来排序。而只是按照max_sort_length规定的若干个字节来进行排序。

  6.采用enum来代替字符串类型。mysql在内部把每个枚举值都保存为整数。enum在内部是按照数字进行排序的,而不是按照字符串。enum最不好的就是字符串列表是固定的,添加和删除必须使用alter table。

  7.ip地址,一般会采用varchar(15)列来保存。事实上,IP地址是个无符号的32位整数,而不是字符串。mysql提供了inet_aton()和inet_nota()函数在证书与ip地址之间进行转换。

三、索引

  1.聚集索引不仅仅是一种单独的索引类型,而且是一种存储数据的方式。Innodb引擎的聚集索引实际上在同样的结构中保存了B-Tree索引和数据行。当表有聚集索引时,它的数据行实际上保存在索引的叶子上。注意是存储引擎来实现索引。

  2.myisam与innodb数据布局:myisam索引树(无论是主键索引还是非主键索引)叶子节点都是指向的数据行,而innodb中聚集索引,主键索引树叶子节点就带得有数据的内容,而非主键索引树中叶子节点指向主键值,而不是数据的位置。

  3.mysql有两种产生排序结果的方式:使用文件排序,或者扫描有序的索引。目前只有myisam支持全文索引。

  4.myisam表有表级锁;myisam表不支持事务,实际上,myisam并不保证单条命令完成;myisam只缓存了mysql进程内部的索引,并保存在键缓存区内。OS缓存了表的数据;行被紧密的保存在一起,磁盘上的数据有很小的磁盘占用和快速的全表扫描。

  5.innodb支持事务和四种事务隔离级别;在mysql5.0中,只有innodb支持外鍵;支持行级锁与mvcc;所有的innodb表都是按照主键聚集的;所有索引(出开主键)都是按主键引用行;索引没有使用前缀压缩,因此索引可能比myisam大很多;数据转载缓慢;阻塞auto_increment,也就是用表级锁来产生每个auto_increment。

四、MYSQL性能分析

  1.mysql提供了一个benchmark(int 循环次数,char* 表达式); 可以分析表达式执行所花时间。 例如:

// select BENCHMARK(10000,SHA1(‘aaaaaaaaaaaaaaaa‘))

  2.mysql有两种查询日志:普通日志和慢速日志。

五、MYSQL高级特性

  1.在mysql中,只有myisam存储引擎支持全文索引。myisam全文索引是一种特殊的具有两层结构的B树。

  2.存储引擎事务在存储引擎内部被赋予acid属性,分布式(XA)是一种高层次事务,它可以历哟内部个两段提交的方式将acid属性扩展到存储引擎外部,甚至数据库外部。阶段1:通知所有提交者准备提交 阶段2:通知所有参与者进行真正提交。

  3.mysql 的字符集和校对规则有 4 个级别的默认设置:服务器级、数据库级、表级和字段级。Mysql4.1 开始支持 SQL 的子查询。

技术分享
/******************************************/
/*   数据库全名 = degopen@10.218.249.92:3318【mysql】   */
/*    表名称 = task_new   */
/******************************************/
CREATE TABLE `task_new` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT ‘主键‘,
  `task_name` varchar(128) NOT NULL COMMENT ‘任务名称‘,
  `image` varchar(128) DEFAULT NULL COMMENT ‘任务图标‘,
  `description` varchar(1024) NOT NULL COMMENT ‘任务描述‘,
  `content` varchar(1024) NOT NULL COMMENT ‘任务内容‘,
  `finished_message` varchar(128) DEFAULT NULL COMMENT ‘任务完成提示信息‘,
  `task_scope` int(11) NOT NULL COMMENT ‘任务范围, 0-平台任务, 1-游戏任务‘,
  `series_task` int(11) NOT NULL DEFAULT ‘0‘ COMMENT ‘任务类型: 系列任务,单独任务‘,
  `task_type` int(11) NOT NULL DEFAULT ‘0‘ COMMENT ‘任务类型: 固定任务, 推广任务, 日常任务‘,
  `pre_task` varchar(128) DEFAULT NULL COMMENT ‘前置任务‘,
  `post_task` varchar(128) DEFAULT NULL COMMENT ‘后置任务‘,
  `task_status` int(11) NOT NULL COMMENT ‘任务状态, 待审核、未开始、生效中、已暂停、已完成、审核未通过‘,
  `auto_task` tinyint(4) NOT NULL DEFAULT ‘1‘ COMMENT ‘是否手动任务, 0-否, 1-是‘,
  `is_required` tinyint(4) NOT NULL COMMENT ‘是否必须任务‘,
  `event_type` varchar(64) DEFAULT NULL COMMENT ‘关心的事件类型‘,
  `task_target` bigint(20) DEFAULT ‘0‘ COMMENT ‘任务目标‘,
  `reset_num` int(11) NOT NULL COMMENT ‘重置次数‘,
  `reset_cycle` int(11) NOT NULL COMMENT ‘重置周期‘,
  `task_interval` int(11) NOT NULL COMMENT ‘任务间隔‘,
  `xiaoer` bigint(20) unsigned NOT NULL COMMENT ‘创建人‘,
  `review_id` bigint(20) unsigned NOT NULL COMMENT ‘审核人ID‘,
  `last_start_time` datetime DEFAULT NULL COMMENT ‘上次生效时间‘,
  `gmt_create` datetime NOT NULL COMMENT ‘创建时间‘,
  `gmt_modified` datetime NOT NULL COMMENT ‘修改时间‘,
  `start_time` datetime NOT NULL COMMENT ‘开始时间‘,
  `end_time` datetime NOT NULL COMMENT ‘结束时间‘,
  `start_condition` varchar(1024) NOT NULL COMMENT ‘任务触发条件‘,
  `end_condition` varchar(1024) NOT NULL COMMENT ‘任务完成条件‘,
  `enable` tinyint(4) NOT NULL DEFAULT ‘1‘ COMMENT ‘是否可用‘,
  `rule` varchar(4096) NOT NULL COMMENT ‘任务规则‘,
  `priority` int(11) NOT NULL DEFAULT ‘1‘ COMMENT ‘任务优先级‘,
  `progress_rule` varchar(2048) NOT NULL DEFAULT ‘‘ COMMENT ‘进度计算规则‘,
  `order_no` int(11) DEFAULT ‘1‘ COMMENT ‘排序号‘,
  `classification` int(11) DEFAULT ‘0‘ COMMENT ‘0:默认分类\n1:玩游戏\n2:抽奖‘,
  `level` int(11) DEFAULT ‘0‘ COMMENT ‘针对同一个分类,不同的等级‘,
  `ext1` longtext COMMENT ‘扩展字段1(UU中使用该字段指示按钮跳转)‘,
  `ext2` longtext COMMENT ‘扩展字段2,暂时预留‘,
  `channel` int(11) DEFAULT ‘0‘ COMMENT ‘任务渠道:0-uu或者1-game_box‘,
  `consecutive_day` int(11) DEFAULT ‘1‘ COMMENT ‘连续完成任务的天数‘,
  `activity` varchar(256) DEFAULT ‘default‘ COMMENT ‘任务所属的活动名字‘,
  `device` text COMMENT ‘机型‘,
  `packages` text COMMENT ‘应用‘,
  PRIMARY KEY (`id`),
  KEY `name_channel` (`task_name`,`channel`),
  KEY `activity` (`activity`(255))
) ENGINE=InnoDB AUTO_INCREMENT=1194 DEFAULT CHARSET=utf8 COMMENT=‘任务表‘;

数据库表结构设计方法及原则

标签:isolation   ioi   存储过程   连续   主键索引   详细   计数   存储介质   sign   

人气教程排行