58到家数据库30条军规解读
时间:2021-07-01 10:21:17
帮助过:19人阅读
此篇文章来源于微信公众号[架构师之路],为了帮助记忆,现在抄写与此,如有侵权,告知立刻删除,谢谢!
军规使用场景:并发量大、数据量大的互联网业务
基础规范
- 必须使用 InnoDB 存储引擎:支持事务、行级锁、并发性能更好、CPU及内存缓存页优化使得资源利用率更高
- 必须使用 UTF8 字符集:万国码、无需转码、五乱码风险,节省空间
- 数据表、数据字段必须加入 中文注释 :好记忆不如烂笔头
- 禁止 使用存储过程、视图、触发器、Event:高并发大数据的互联网业务,架构设计思路是“解放数据库CPU,将计算转移到服务层”,并发量大的情况下这些功能可能将数据库拖死,业务逻辑放到服务层具备更好的扩展性,能够轻易实现“增机器就加性能”。数据库擅长存储与索引,CPU计算还是上移吧。
- 禁止 存储大文件或者大图片:不要让数据库做不擅长的事,大文件和图片存储在文件系统,数据库里存URI就好。
命名规范
- 只允许使用 内网域名 ,而不是ip来连接数据库
- 线上环境、开发环境、测试环境数据库内网域名遵循命名规范:
- 库名、表名、字段名:小写,下划线风格,不超过32个字符,必须见名知意,禁止拼音英文混用
- 表名txxx, 非唯一索引名idxxxx, 唯一索引名uniq_xxx
表设计规范
- 单实例表的数目必须小于500
- 单表的列数目必须小于30
- 表必须有主键,例如自增主键:提高数据插入性能,避免page分裂,减少表碎片提升空间和内存的使用;主键选择较短的数据类型,减少索引的磁盘空间,提高索引的缓存效率;无主键的表删除,在row模式的主从架构,会导致备库绷住
- 禁止 使用外键,如果有外键完整性约束,需要应用程序控制:外键会导致表与表之间耦合,update与delete操作都会涉及相关联的表,十分影响sql的性能,甚至造成死锁。大数据高并发业务场景下数据使用以性能优先
字段设计规范
- 必须把字段设计为 NOT NULL 并且提供默认值:null的列使索引/索引统计/值比较都更加复杂,对MySQL来说更加难优化;null类型在MySQL中需要特殊处理,消耗数据库性能;null值需要更多的存储空间,无论是表还是索引中的null值都需要额外的空间来标识;对null的处理只能使用is null 或is not null,而不能采用=、in等操作符号。
- 禁止 使用TEXT、BLOB类型:浪费更多的磁盘和内存空间,导致缓存命中率低,影响性能
- 禁止 使用小数存储货币:小数容易导致精度误差
- 必须使用varchar(20)存储手机号:可能涉及区号或国家代码,varchar支持模糊查询 like
- 禁止 使用ENUM, 可使用TINYINT代替:增加新ENUM值要做DDL操作,内部实际就是整数
索引设计规范
- 单表索引建议控制在5个以内:太多影响update和delete性能
- 单索引字段数不允许超过5个:太多起不到过滤效果
- 禁止 在更新十分频繁、区分度不高的属性上建立索引:更新会变更底层的B+树,更新频繁的字段建立索引会大大降低数据库性能;区分度不高的属性,建立索引起不到过滤数据的效果,性能与全表扫描类似
- 建立组合索引,必须把区分度高的字段放在前面:能够更加有效过滤数据,与查询优化器算法相关
SQL使用规范
- 禁止 使用SELECT *,只获取必要的字段,需要显示说明列属性:增加消耗,不能有效利用覆盖索引,容易在增加或删除字段后出现程序BUG
- 禁止 使用INSERT INTO t_xxx VALUES(xxx), 必须显示指定插入的列属性:容易在增加或删除字段后出现程序BUG
- 禁止 使用属性隐式转换:会导致不能命中索引,而采用全表扫描;SELECT uid FROM tuser WHERE phone=13812345678会导致全表扫描,而不能命中phone索引,因为phone字段是varchar(20),正确的写法是:SELECT uid FROM tuser WHERE phone=’13812345678′;
- 禁止 在WHERE条件的属性上使用函数或者表达式:会导致不能命中索引,而采用全表扫描;SELECT uid FROM tuser WHERE fromunixtime(day)>=’2017-02-15’会导致全表扫描,正确的写法是:SELECT uid FROM tuser WHERE day>=unixtimestamp(‘2017-02-15 00:00:00’)
- 禁止 负向查询,以及%开头的模糊查询:负向查询条件:以NOT、!开头或者<>,导致全表扫描;%开头的模糊查询,导致全表扫描
- 禁止 大表使用JOIN查询,禁止大表使用子查询:会产生临时表,消耗较多内存与CPU,极大影响数据库性能
- 禁止 使用OR条件,必须改为IN查询:MySQL旧版本OR查询不能命中索引,新版本需要消耗CPU才能查询优化后命中索引
- 应用程序必须捕获SQL异常,并有相应处理
小结
大数据量高并发的互联网业务,极大影响数据库性能的都不让用。
58到家数据库30条军规解读
标签:索引 内网 不能 设计规范 精度 大数据 服务 amp 机器