榜单:有望改变2022年科学进程的7大前沿技术



端粒到端粒(T2T)合作组正在对所有染色体进行测序。来源:Adrian T. Sumner/SPL

1. 完整版基因组

2019年,加州大学圣克鲁兹分校的基因组学研究员Karen Miga和美国国家人类基因组研究所的Adam Phillippy成立了端粒到端粒 (T2T)合作组,当时约有1/10的人类基因组仍然未知。如今,这个数字已经降到了零。在去年5月发布的一篇预印本论文中, T2T合作组公布了首个人类基因组的端到端序列,为大量使用的人类参考基因组序列GRCh38新增了近2亿个碱基对,并为人类基因组计划 (Human Genome Project)补全了最后一章 [1]

首次于2013年公布的GRCh38是一个很重要的研究工具,也是绘制测序序列的框架,但这个框架上还开着很多“天窗”。这主要是因为广泛使用的测序技术 (由加州Illumina公司开发)虽然读长很准确,但太短, 无法清晰绘制出高度重复的基因组序列,包括染色体末端的端粒以及在细胞分裂中协调新复制DNA分裂的着丝粒。

长读长测序技术被证明能改变之前的测序规则。这一技术由美国太平洋生物科学公司 (Pacific Biosciences)和英国牛津纳米孔技术公司 (ONT)联合开发,可以一次性读取数万乃至数十万个碱基并进行排序,虽然在刚开始时并不绝对准确。然而,当2020年T2T合作组首次重组了单独的X染色体和8号染色体时 [2,3],Pacific Biosciences公司的测序技术已经可以让T2T的科学家检测到长片段重复序列中的微小突变。这些微小“指纹”让长段重复的染色体片段变得更易处理,基因组的其余部分也能迅速归位。ONT公司的平台还发现了许多调节基因表达的DNA修饰,而T2T合作组也能在全基因组范围内绘制这些“表观遗传标记” [4]

T2T合作组解析的这个基因组来自一个包含两组相同染色体的细胞系。正常的二倍体人类基因组中,每个染色体都有两个版本,研究人员正在研究“基因分型” (phasing)策略,这种策略可以将每个序列准确分配给对应的染色体拷贝。Miga说:“我们已经获得了一些非常出色的分型组装。”

这项二倍体组装工作是与T2T的合作组织——人类泛基因组参考合作组 (Human Pangenome Reference Consortium)——共同完成的,该合作组希望基于来自世界各地的数百个捐赠,绘制出更具代表性的基因组图谱。合作组的首席研究员、纽约洛克菲勒大学遗传学家Erich Jarvis说:“我们的目标是了解平均97%的人类等位基因多样性。”作为脊椎动物基因组项目 (Vertebrate Genomes Project)的主席,Jarvis还希望通过这些完整基因组的组装能力,获得地球上每一种脊椎动物的完整基因序列。他说:“ 我相信在未来10年内,端粒到端粒的基因组组装将是一种常态。

2. 蛋白质结构解析

结构决定功能,但鉴定结构却很难。在过去的两年里,实验与计算方面的进步提供了更多的趁手工具,让研究人员能以空前的速度和分辨率解析蛋白质的结构。

AlphaFold2结构预测算法由位于伦敦的谷歌子公司DeepMind开发,它能依靠“深度学习”策略,从折叠蛋白质的氨基酸序列推断其形状 [5]。在2020年的蛋白质结构预测大赛CASP上,计算生物学家同台竞技,比拼各自的蛋白质结构预测算法, 但最终AlphaFold2所向披靡,知名度和普及率也一路飙升。欧洲生物信息研究所高级科学家、前所长Janet Thornton说:“AlphaFold2对某些结构的预测可以说好得出奇。”自去年7月对外公开以来,AlphaFold2已被应用于蛋白质组学研究,以确定人类 [6]和20种模式生物表达的所有蛋白质的结构 (见Nature595, 635 2021;颠覆生命科学!AlphaFold预测完整人类蛋白质组结构,并用来鉴定Swiss-Prot数据库中近44万种蛋白质的结构,大大增加了拥有高置信度建模数据的蛋白质数量。AlphaFold2的算法也证实了它具有解析多链蛋白质复合物的能力 [7]

与此同时, 冷冻电镜(cryo-EM)的升级换代也使研究人员能用实验方法来对付那些最棘手的蛋白质及其复合物。冷冻电镜利用电子束扫描快速冻结的分子,从多个角度生成蛋白质的图像,再通过计算将这些图像重新组装成一个3D结构。2020年,冷冻电镜的软硬件得到升级后,两个团队获得了1.5埃以下的结构分辨率,确定了单个原子的位置 [8,9]。纽约结构生物学中心西蒙斯电镜中心联合主任Bridget Carragher说:“在那之前,虽然我们动不动就说什么‘原子分辨率’,但那都只能算是接近原子水平, 而这才是真正的原子水平。”Carragher说,尽管两个团队使用的都是脱铁铁蛋白这种经过充分研究的模式蛋白,但他们的研究表明,对于其他更难的目标,达到近原子分辨率也是可行的。

来自冷冻电镜的图像能帮助解析复杂的结构。来源:Paul Emsley/MRC分子生物学实验室




上一篇:上海家化:上海家化2020年年度报告
下一篇:11类肿瘤抗原