大规模G蛋白偶联嗅觉受体配对数据及其建模



AcsCentSci | 大规模G蛋白偶联嗅觉受体配对数据及其建模

2022-04-18 09:08 来源: 中大唯信-唯信计算

原标题:AcsCentSci | 大规模G蛋白偶联嗅觉受体配对数据及其建模

原创 竹苓 唯信计算

大规模G蛋白偶联嗅觉受体配对数据及其建模

嗅觉受体 (OR) 的氨基酸序列如何编码对各种配体的多样化反应?一个基于 OR 序列相似性和配体物理化学特征的蛋白质化学计量学 (PCM) 模型可以使用监督机器学习预测 ORs 对气味的反应。命中率高达 58%,发现了 64 对新的 OR-气味剂。

背景介绍

嗅觉受体(ORs)是G蛋白偶联受体家族的一类成员,具有敏感的气味辨别能力。但是受体序列中微小的差异可能表现出不同的功能,同时不同的序列也可能会表现出相似的功能。与OR结合的配体是各种各样的气体分子,OR 通过变构机制对配体作出反应。目前研究认为,配体亲和力是由口袋残基决定的,对相同气味有反应的 OR 在口袋周围具有更高的序列同源性。

OR 可区分大量挥发性分子并编码大脑中感知到的气味。OR 和气味之间的映射关系是理解气味感知的关键。机器学习在预测 OR 对气味的反应的研究中已经取得了巨大成功,但是稀疏的气体数据限制了模型的效果。目前常用的策略是通过特征选择来降维,从OR序列中筛选出重要残基,可改善模型效果。本文作者使用 OR 序列比对、 PCM和机器学习来预测 OR 对各种气味的反应。PCM 模型可提取 OR 序列相似性和气味剂的化学特征。除此之外,作者还在体外评估了相关残基的选择和模型预测结果。

主要内容

OR-气味配对数据集准备

本文作者检索了文献中hORs(人嗅觉受体)和 mORs(鼠嗅觉受体)与气体的样本数据,包括 1293 个 OR-气味剂对,由 390 种 OR受体和 244 种气味剂组成,然后又纳入了14400 对阴性气味剂,阴性气味剂在体外无反应。作者选用苯乙酮、香豆素、R-香芹酮和 4-色原酮作为目标气味剂,随后又加入了与 4 种目标气味剂具有相似化学结构的气味剂的数据。

分子模型建模

首先寻找正位配体结合口袋内的气味结合残基。小鼠OR作为原型,它对四种目标气味剂中的三种有反应。分子动力学模拟建立了与气味剂结合的3D同源模型。3D 模型是在保守氨基酸基序和覆盖 TM 结构域近 50%(95 个残基)的定点诱变数据的约束下构建的。在结合气味剂分子的 5 Å 距离空间内含有 17 个残基(以下称为 poc17,图 1B)。这些残基中的 14 个已被证明对通过定点诱变对气味的 OR 反应很重要。

大规模G蛋白偶联嗅觉受体配对数据及其建模

图1. 机器学习流程与残基选择。图片来源:AcsCentSci

结合位点残基突变

作者在poc17 周围诱导了 24 个点突变。体外剂量依赖性反应可以测定突变受体对五种配体的反应的影响。突变效应与文献中报道的所有 OR 突变都标注到了3D 模型上(图 1B)。其中包括 poc17 和 3 个外围残基在内的 20 个残基,组成了一个更大的正构口袋 (poc20)。poc20 内的突变影响了受体对大多数气味的反应。

作者尝试寻找最佳残基子集。根据上述结果选择了 5 个从小到大的残基子集:poc17、poc20、poc27、poc60 和 TM191。其中poc27 和 poc60 是口袋的延伸,距离结合气味剂周围 6 和 8 Å,分别包含 27 和 60 个残基(图 1C)。TM191 包含由 191 个残基组成的整个配体结合的区域。作者使用这些残基子集构建机器学习模型。

PCM与机器学习

从hORs和mORs的序列比对中,作者提取了5个启发式残基子集。PCM 模型是使用表 1 中的数据和气味剂的物理化学特征构建的。作者使用 5 折交叉验证训练和评估支持向量机 (SVM) 和 随机森林模型(RF)。模型预测了每个 OR-气味对的响应概率,概率 > 0.5 被归类为响应。Matthew 相关系数 (MCC) 用于衡量模型效果。结果表明RF 的表现优于 SVM。五个 RF 分类器的预测性彼此之间没有显著差异。

poc60 分类器平均表现最好。为了确定最佳残基子集,使用表 1 中 100% 的数据构建了五个最终 RF 分类器(poc17、poc20、poc27、poc60 和 TM191)。然后使用每个分类器筛选4个目标气味剂的新 OR 。每个分类器预测并给出OR对 4 种气味中各自预测的概率。

大规模G蛋白偶联嗅觉受体配对数据及其建模

表1. 查询的气味剂(粗体)的化学结构、PubChem CID、训练数据及其类似物的信息。表格来源:AcsCentSci

相关残基的体外评价




上一篇:粘附类G蛋白偶联受体激活通用机制研究获突破
下一篇:深圳市发展和改革委员会关于印发《深圳市产业结构调整优化和产业导向目录(2016年修订)》的通知