NCBI中RefSeq各种accession说明(一)



我们在NCBI上找序列时,特别是看Blast结果时,经常会看到各种标记的序列,不知道哪个才是想要的,特此查了相关资料,找到了一些说明。根据个人经验,如果想找标准序列的话,mRNA就采用NM_开头的,基因组用NC_或者AC_开头的,有关RNA的编号说明,可以参考下一篇文章。
具体的各项说明及序列来源说明请参考

Accession Molecule Note
AC_123456   Genomic   Mixed  

一些可供选择的注释的基因组序列,主要用来标记病毒和原核生物。

 
AP_123456   Protein   Mixed  

AC_标记序列对应的蛋白产物。

 
NC_123456   Genomic   Mixed  

完整的基因组分子序列,标记的类别包括基因组、染色体、细胞器、质粒。

 
NG_123456   Genomic   Mixed  

不完整的基因组区域,提供NCBI基因组注释途径。比较有代表性有不转录的假基因或者那些很难自行化注释的基因组簇。

 

NM_123456

NM_123456789

  mRNA   Mixed  

转录产物序列;成熟mRNA转录本序列。

 

NP_123456

NP_123456789

  Protein   Mixed  

蛋白产物;主要是全长转录氨基酸序列,但也有一些只有部分蛋白质的部分氨基酸序列。

 
NR_123456   RNA   Mixed  

非编码的转录子序列,包括结构RNAs,假基因转子等。

 
NT_123456   Genomic   Automated  

BAC或者鸟枪测序法的还未完全注释的测序序列。

 

NW_123456

NW_123456789

  Genomic   Automated   BAC或者鸟枪测序法的还未完全注释的测序序列。  
NZ_ABCD12345678   Genomic   Automated  

收集的各种利用鸟枪法测序的测序计划,ABCD代表的是计划的名称。

 

XM_123456

XM_123456789

  mRNA   Automated  

转录产物;mRNA来自基因组注释,序列相当于基因组重叠群。

 

XP_123456

XP_123456789

  Protein   Automated   蛋白产物。序列相当于基因组重叠群。  
XR_123456   RNA   Automated   转录产物;非编码区来自基因组注释,序列相当于基因组重叠群。  

YP_123456

YP_123456789

  Protein   Mixed  

蛋白产物。不涉及到转录,主要用来标记细菌、病毒和线粒体。

 
ZP_12345678   Protein   Automated   蛋白产物,主要是用电脑自动注释。  
NS_123456   Genomic   Automated   未知生物分子基因组序列。  




上一篇:【资源分享】蛋白质工程原理与应用(全书PDF)
下一篇:泰迪错把酒当水喝 主人:它舔了两滴 走路歪歪倒