Nature:人类基因组计划20年, 明星基因大放异彩,生物网络亟待探索




导语


人类基因组计划(Human Genome Project, HGP)是一项规模宏大、跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的由30亿个碱基对所组成的核苷酸序列,从而绘制人类基因组图谱、辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。2021年2月11日,在人类基因组图谱发布20周年之际,Nature刊登的一篇网络科学学者Albert-László Barabási等人的评论文章,分析了自2001年以来基因组研究领域的发表刊物、研发药物与人类疾病的影响关系,旨在为未来基因组研究提供新的视角。


Alexander J. Gates, Deisy Morselli Gysi, Manolis Kellis, Albert-László Barabási | 作者

胡一冰 | 译者

赵雨亭、刘培源 | 审校

邓一雪 | 编辑





 

 

1. 基因组计划研究趋势



 

 
人类基因组图谱第一版
[1,2]
发表20周年是一个契机,让我们能回溯该项目如何促进了人类疾病的基因根源研究、如何改变了药物研发以及如何协助修正我们对基因本身的理解。 在这里,我们根据现有资料预测关于人类基因组未来研究的影响和趋势。研究者们结合多个数据集来量化已经发现并被发表的不同类型的遗传因素
(genetic element)
;以及这些年来,发现和发表的模式是如何变化的。分析利用的数据具体包括38546个RNA转录物
(transcripts)
、约100万个单核苷酸多态性
(Single Nucleotide Polymorphisms, SNPs)
、1660种有记载的受遗传影响的人类疾病、7712种已批准和试验的药物和704515篇1900至2017年间的科研著作。

图1. Nature和Science为纪念HGP20周年的特别封面

 研究结果强调了人类基因组计划(Human Genome Project , HGP)及其全面的蛋白质编码基因清单如何开辟展示基因组非编码部分功能的新时代,并为未来的医药开发铺平道路。关键的是,研究人员绘制亚细胞结构
(cellular building blocks)
之间的相互作用图时,研究结果可追溯到生物学系统层视图与传统单基因视图的出现。 本项分析也存在局限性。例如,学界对部分基因的起始位点、终止位点,甚至是某些基因的确切编码序列都没有达成共识
[3]
。一些基因元件使用多种命名规则,因此有时研究人员无法将它们统一起来。此外,有些作者没有将学术著作和基因序列之间的联系添加到数据库中。最后,考虑到文章的发表和进入我们使用的数据库之间可能会存在时间差,我们用来构造相互作用图表的数据截止于2017年。
然而,我们并不认为这些问题会影响我们在基因组计划研究中所发现的整体趋势。当我们归一化同期生物学出版物的增长数目时,趋势仍然存在
(如图2所示)
。本项研究没有控制基因发现后的进程,但作者判断这样假设处理之下,结论依然成立。

图2. 基因研究中的“偏好依附”现象
 这些联系提供了人类基因组计划前后研究格局演变的快照。它表示了学术界对少数“超级明星”蛋白质编码基因的强烈关注,这可能会减少潜在的、对其它基因的研究。基因组的非蛋白质编码部分以及遗传物质和蛋白质之间的互作一直是研究的重点。事实是,药物研发更多基于少数某些蛋白质靶点。 其中一些趋势被生物学家们所熟悉,但要量化和形象化这些趋势,就必须以全新的方式研究它们。

图3. 1950年至2020年基因研究合作项目成员规模变化 世界上没有可与人类基因组计划比肩的对照组。因此,不能表明上述趋势是否必然会随着人类基因组计划而出现。从计算能力的提高到复杂的排序方法的发明,种种外部因素也在这些发展中发挥了作用。唯一可以确定的是,人类基因组计划目录推动了基因革命的进行。





 

 


上一篇:2021年公务员考试行测练习:文章阅读(80)
下一篇:《人类基因组计划的经济影响》完整译文