碱基对增至30.5亿!迄今最全人类基因组测序工作



  人类基因组计划(Human Genome Project, HGP)被誉为生命科学的 “登月计划”。2001 年,由 HGP 和 Celera 基因组公司之间相互竞争而又各自独立完成发表了人类基因组草图,被认为是一大里程碑。

  而现在,这项成就可能即将被超越,因为以前的所有草案都遗漏了约 8% 的基因组。

  近日,一个国际科学团队 “端粒到端粒(T2T)” 联盟宣布,他们已经对整个人类基因组进行了测序,包括 20 年前第一个人类基因组测序时遗漏的 8% 的基因组。

  该团队在 5 月 27 日发布了预印本文章,对其测序工作进行了详细介绍。

  加州大学圣克鲁兹分校的研究人员 Karen Miga 是 T2T 联盟的共同领导人,她认为对整个人类基因组进行测序是在试图挖掘人类基因组的最后一个未知数,而此前从未成功的原因是难度太大。

  

碱基对增至30.5亿!迄今最全人类基因组测序工作


  图 | karen miga(来源:karen miga 个人官网)

  帮助 T2T 联盟进行基因组测序的是两家私营公司:加利福尼亚州门洛帕克的太平洋生物科学公司(又称 PacBio),和英国牛津科学园的牛津纳米孔公司。牛津纳米孔的测序技术在这项研究中发挥了明显的优势。

  欧洲分子生物学实验室的副总干事 Ewan Birney 指出,最初的基因组论文措辞谨慎,因为它们没有对每个 DNA 分子从一个端粒到另一个端粒进行测序。而 T2T 联盟表明他们可以做到,这对未来的研究很重要。

  哈佛大学生物学家和测序先驱 George Church 称自己以前喜欢在讲座中指出 “到目前为止,还没有人对脊椎动物的整个基因组进行测序”,但如果 T2T 联盟的测序工作被证实,就不一样了。

  

碱基对增至30.5亿!迄今最全人类基因组测序工作


  图 | 基因测序(来源:britannica)

  T2T 联盟表示,他们将测得 DNA 碱基的数量从 29.2 亿增加到 30.5 亿,增加了 4.5%。基因的数量只增加了 0.4%,达到了 19969 个,但并不意味着不能带来其他新见解。

  此项基因组测序工作也存在一些局限性,包括研究人员为了加快工作进度而使用的细胞系类型。

  他们所采用的 DNA 序列不是来自人,而是来自女性子宫中的水泡状胎块(俗称的葡萄胎),这是由没有细胞核的卵子受精引起的,意味着它只含有 23 条染色体,而不是 46 条,这使得创建 DNA 测序工作变得更简单。

  2003 年的原始基因组草案也只包含 23 条染色体,但随着 DNA 测序技术变得更便宜和简易,研究人员倾向于对全部 46 条染色体进行测序。

  

碱基对增至30.5亿!迄今最全人类基因组测序工作


  图 | 人类染色体(来源:harsehaj)

  由于这些细胞系被保存在实验室中,全国儿童医院基因组医学研究所的联合执行主任 Elaine Mardis 担心它们可能会发生变异,产生新的遗传信息,“细胞系经过多年繁育,可能积累大量残渣”。

  Miga 回应道,通过研究发现,该细胞系与人类细胞相似,而且研究人员使用的是冷冻保存的细胞。不过她也认可团队下一步应对包含 46 条染色体的二倍体基因组进行测序。

  Miga 与美国国立卫生研究院的研究员 Adam Phillippy 合作,提议在 2019 年启动目前的计划,并以染色体末端的端粒命名,即 “端粒到端粒联盟”(Telomere 2 Telomere Consortium)。华盛顿大学生物学家 Evan Eichler 也受邀加入了 T2T 联盟,在此前他一直为基因组缺失部分感到担忧。

  

碱基对增至30.5亿!迄今最全人类基因组测序工作


  图 | T2T 联盟 (来源:longreadclub)

  即使利用 DNA 测序技术对基因组其他部分进行测序的成本已从 3 亿美元降至 300 美元,但他们仍然花了 20 年时间才完成对最后 8% 基因组的测序工作。

  Illumina 公司制造的 DNA 测序仪是对一小段 DNA 进行解码,然后重新组装成序列图谱。这对大部分基因组来说都管用。但这种测序方式对长重复模式的 DNA 序列行不通了,因此 8% 的基因组也就被遗漏下来了。




上一篇:“母女癌”,“夫妻癌”频频出现,癌症会遗传吗?
下一篇:没有了