Genome Updater for refseq database
NCBI的参考序列(RefSeq)计划,为多种生物提供序列的数据信息及相关资料, 用于医学、基因功能和基因功能比较研究。RefSeq数据库中所有的数据是一个非 冗余的、提供参考标准的数据,包括染色体、基因组(细胞器、病毒、质粒)、 蛋白、RNA等 Genbank是一个开放的数据库,对每个基因都含有许多序列。很多研究者或者公 司都可以自己提交序列,另外这个数据库每天都要和EMBL和DDBJ交换数据数据可 能重复或者不准。 RefSeq数据库被设计成每个人类位点挑出一个代表序列来减少重复,是NCBI提供 的校正的序列数据和相关的信息。数据库包括构建的基因组contig、mRNA、蛋白 和整个染色体。refseq序列是NCBI筛选过的非冗余数据库,一般可信度比较高。
NM开头的表示标准序列,XM表示预测的蛋白编码序列,NR_表示非编码蛋白的mRNA 序列,AF开头的表示克隆序列,BC开头的表示模板序列。