里程碑!最完整的人类基因组序列首次公布!



里程碑!最完整的人类基因组序列首次公布!

4月1日凌晨,被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。

里程碑!最完整的人类基因组序列首次公布!

里程碑!最完整的人类基因组序列首次公布!

它有多重要呢?最新一期Science把封面位置给了这项成果,并一口气刊登6篇论文,多方位概述了人类基因组测序工作背后的新发现以及对新基因组区域的一些初步分析。或能将我们对人类的生长发育和疾病的了解,推向了新的高度!

里程碑!最完整的人类基因组序列首次公布!

▲《科学》杂志以封面报道和专题的形式介绍了人类基因组测序新成果
填补8%的空白
对人类基因组的研究,已经有50多年的历史。其中最有名的研究项目,是1990年启动的“人类基因组计划”。2003年4月14日,多国实验室耗费10多年的时间和30亿美元的资金,完成了人类基因组计划的测序工作,首次绘制出了人类基因组的图谱。当时的测序工作,大大推动了基因组学的研究,增加了我们对人体和疾病的理解。
但是,当时人类基因组计划得出的序列中,仍然留下了大约8%的空白,其中包含了很多高度重复的DNA序列,加起来有一条染色体那么长。

里程碑!最完整的人类基因组序列首次公布!

▲人类的1至22号染色体
这8%的缺失,源于20年前测序技术的限制。当时使用的测序方法是“短读长测序”技术(“short-read" technology),一次只能读取很短的一段基因序列。
举个例子
如果把基因组的一部分想象成段落中的一句话,比如“今天早上小明吃了个包子”,通过短读长测序,研究者能得到很多简短的小部件,比如“今天”“小明”“明吃”“包子”;再经过“拼图”式的分析,他们就可以拼凑出这句完整的话。

里程碑!最完整的人类基因组序列首次公布!

然而,研究者虽然能知道这段基因里含有的简短小序列,却无法知道这段基因被重复了多少次。也就是说,研究者能够拼凑出“今天早上小明吃了个包子”这句话,但却不知道这句话在整个段落里是否重复出现、重复了多少次。正因缺少这些信息,在过去的20年里,重复序列一直是基因组学研究的一大难题。
直到两种新技术诞生,人类基因组学的研究才迎来了转折点。这两种技术都属于“长读长测序”技术(“long-read" technology),一种是牛津纳米孔测序(Oxford Nanopore DNA sequencing),它可以一次读取多达100万个DNA碱基,准确度中等;另一种是PacBio HiFi测序,一次只能读取2万个碱基,但准确度近乎完美。这两种技术,都可以一次性测出大块的DNA序列,研究者可以直接看到一整个句子甚至段落,也就能知道某个序列连续重复了多少次。

里程碑!最完整的人类基因组序列首次公布!

▲T2T联盟的联合主席凯伦·米加(Karen Miga)和亚当·菲利比(Adam Phillippy)
从2019年初开始,T2T联盟的科学家将这两种新技术结合起来,致力于攻克这些重复序列,填补缺失的空白。2020年底,他们公布了阶段性成果——X染色体和8号染色体的完整组装。经过之后2年的努力,现在,他们终于揭开了真正完整的人类基因组序列,从端粒到端粒,包含了每一条染色体。
最完整的人类基因组图谱
新的基因组图谱版本被称为T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。
◉它比上一个版本增加了近2亿个碱基对以及2000多个新基因。
◉绘制了更精确的五条染色体臂的图谱,这将有助于进一步增加人们对染色体的认识。
◉覆盖了基因组中最复杂的一些区域,包括在重要染色体结构中及其周围发现的高度重复的DNA序列,如着丝粒和核糖体DNA。着丝粒是将两条染色体连接在一起的部分,在细胞分裂中起着关键作用。核糖体DNA为细胞的蛋白质工厂提供指令。还有一些可能帮助物种适应的新基因。
◉还发现了人类基因组中超过200万个变异,为622个医学相关的基因组变异提供了更准确的信息。
◉新序列还纠正了2013年发布的参考基因组序列GRCh38中的数千个结构错误。

里程碑!最完整的人类基因组序列首次公布!

▲数字显示器显示 DNA 测序仪的输出
“人类基因组的这些部分,对我们理解基因组如何工作、遗传疾病、人类多样性和进化非常重要。”美国加州大学圣克鲁兹分校的凯伦•米加表示。
对此,人类基因组计划的中国参与者、中国科学院基因组所研究员于军则比喻说:“假如说把人类基因组序列比作一辆非常复杂的汽车,与20年前完成的人类基因组草图相比,完整的新序列相当于增添了更多零件。”
后续的计划
毫无疑问,这个新的人类基因参考图谱将会对基因组分析产生重大影响,比如个性化医疗、人群基因组分析和基因组编辑方面。欧洲分子生物学实验室的副主任、生物信息学家尤恩·伯尼表示:“即使是5年前,我们也没有想到能做到这一点,更不用说10年前了。这些研究工作极为出色。”
虽然,这些新的研究工作使基因组测序达到了一个新的里程碑,但人类基因组测序仪器并没有完全下班。由于使用的细胞系没有Y染色体,但T2T联盟在推特上宣布他们已经确定了Y染色体上缺失序列的正确排列形式。想必离解析出完整的Y染色序列也不远了。
除此之外,人类基因组计划联合负责人、贝勒医学院遗传学家理查德·吉布斯说:“还有一些工作要做。”包括他在内的许多研究人员都强调,现在需要从更多样化的人群中获取完整的基因组序列,来寻找染色体短臂中可能存在的变异,以及获取其他测序难度比较高的区域的变异,因为这些都有可能和疾病或别的性状有关。
此外,他们还有一个新目标——从不同种族或血统的人中提取350个基因组(目前已破译了70个基因组)。这些基因组是人类泛基因组参考联盟的一部分,它们的测序更有挑战性,因为每一对染色体都是两两不同的。最终,科学家希望给每一个基因组,都找出端粒到端粒的完整序列。
本期内容到这里就结束啦
想看更多有趣又实用的内容
赶紧关注我吧
资料来源:环球科学、果壳、iPlants、科学网
部分图片来源于网络,非商业用途,仅作为科普传播素材。如有侵权,请联系删除。

里程碑!最完整的人类基因组序列首次公布!

里程碑!最完整的人类基因组序列首次公布!

点分享

里程碑!最完整的人类基因组序列首次公布!

点点赞

里程碑!最完整的人类基因组序列首次公布!

点在看
原标题:《里程碑!最完整的人类基因组序列首次公布!》




上一篇:韶关医疗实验室建设思路说明SICOLAB
下一篇:干细胞是啥?干细胞疗法却是“神药”!