深度学习助力蛋白质工程



本期文章:《自然—方法学》:Online/在线发表

美国哈佛大学George M. Church研究团队利用基于序列的深度表现学习,对合理的蛋白质工程化设计进行了统一化建模。10月21日,国际知名学术期刊《自然—方法学》在线发表了这一成果。

研究人员将深度学习应用于未标记的氨基酸序列,以将蛋白质的基本特征提炼为统计上的表现形式,其在语义上丰富并且在结构、进化和生物物理上都有扎实的基础。

研究人员表明,基于这个统一表现(UniRep)构建的最简单模型可以广泛应用,并且可以推广到序列空间上的不可见区域。这一数据驱动的方法可与最新方法竞争,从而预测天然和从头设计的蛋白质的稳定性,以及分子多样性突变体的定量功能。UniRep还可以在蛋白质工程任务中将效率提高两个数量级。UniRep是蛋白质基本功能的通用总结,可用于蛋白质工程信息学。

据介绍,合理的蛋白质工程需要对蛋白质功能的全面了解。

附:英文原文

Title: Unified rational protein engineering with sequence-based deep representation learning

Author: Ethan C. Alley, Grigory Khimulya, Surojit Biswas, Mohammed AlQuraishi & George M. Church

Issue&Volume: 2019-10-21

Abstract: 

Rational protein engineering requires a holistic understanding of protein function. Here, we apply deep learning to unlabeled amino-acid sequences to distill the fundamental features of a protein into a statistical representation that is semantically rich and structurally, evolutionarily and biophysically grounded. We show that the simplest models built on top of this unified representation (UniRep) are broadly applicable and generalize to unseen regions of sequence space. Our data-driven approach predicts the stability of natural and de novo designed proteins, and the quantitative function of molecularly diverse mutants, competitively with the state-of-the-art methods. UniRep further enables two orders of magnitude efficiency improvement in a protein engineering task. UniRep is a versatile summary of fundamental protein features that can be applied across protein engineering informatics.

DOI: 10.1038/s41592-019-0598-1

Source: https://www.nature.com/articles/s41592-019-0598-1

期刊信息

Nature Methods:《自然—方法学》,创刊于2004年。隶属于施普林格·自然出版集团,最新IF:28.467
官方网址:https://www.nature.com/nmeth/
投稿链接:https://mts-nmeth.nature.com/cgi-bin/main.plex




上一篇:中国科学家破解非洲猪瘟病毒
下一篇:《嗨唱转起来》神秘嗨唱歌手竟和罗志祥有渊源