时间:2021-07-01 10:21:17 帮助过:26人阅读
冗余是指在一个数据集合中重复的数据称为数据冗余。
有一张字典表 city 其中有 id 和 cityName 两个字段,有一张业务表,其中有 id 、cityId、XXX、XXX…字段。
如果查询业务表的话,就必须 join 一下 city 字典表,如果业务表很大很大,那么就会查询的很慢,这个时候我们就可以使用冗余来解决这个问题,直接将业务表中的 cityId 更换成 cityName,这样我们在查询业务表的时候就不需要去 join 那一张 city 的字典表了。这样的方式显然是不符合我们数据库设计的范式的,但是这样的冗余或许很有必要。
业务表中有一个字段 status 用来存储提交和未提交,假设这张表中未提交的数据相对于提交的数据是很少的,当用户查询所有未提交的数据的时候,就需要在全部的数据,然后筛选出未同意的数据。如果这张业务表非常的庞大,那么这样的查询的效率就非常的慢。
这个时候我们就可以把这张业务表中的未同意的数据冗余到一张新表中,这样用户查询未提交的数据的时候就可以直接在这张未提交的表中查询,查询速度提交很多。
某业务表有这样的一个特点,用户往往都在查询最近三个月(或几个月的)数据,数据每天都在增长,由于数据库表的增长,查询变得原来越慢,性能遇到瓶颈。这个时候可以根据业务将这张表拆分成三个月内数据和三个月外数据,其中三个月外数据还可以按照年份(或月份或季度)拆分成不同的分片。这样用户的查询会大量的命中与三个月内的那张表中,而这张表的数据是有限的,并且数据量并不会特别大,从而解决性能的瓶颈。
某业务表存放着每天的交易数据,用户有的时候想查看某个季度,某一年份的交易总额。几个用户还好,当用户量增加,查询数增加,那么实时查询的方法已经满足不了要求,这个时候我们可以将这一类的汇总数据单独的存放到一张表中,通过在夜间用户量较少的时候计算出来,当用户再次查询的时候我们直接显示这张汇总表中的数据,而不通过查询交易数据表实时计算,这样可以大量的提高性能。
对数据库新的认识之数据冗余
标签:name 存储 不同 基础上 表拆分 实时 学习 数据库表 提升性能