时间:2021-07-01 10:21:17 帮助过:18人阅读
其中,生物体的结构复杂使得碱基序列不能以语言学上的方法处理,并没有固定的基本单位,每一层组学上都有其自身的一套系统。本质上也是因为语言本就是人造的规律,因而符合人的逻辑思维,而自然科学是完全客观的,研究人员需要学习和解读自然。
解决方法:
因此,我们提出二次数据库,主要是用来annotation,提升数据质量,本质上是利用多层面数据库的整合版本将已知的模式从原始数据中去除,对数据去冗余处理。(Eg,NCBI的RefSeq(打通ome)和Gene)
一次数据库|二次数据库|
标签:efs 基因组 大数据 数据质量 高度 二次 seq 就是 了解