用遗传学重构人类历史事件,复旦大学徐书华相



用遗传学重构人类历史事件,复旦大学徐书华相

2022 年 5 月 23 日,生物信息学专业期刊 Briefings In Bioinformatics 在线发表了复旦大学徐书华团队的研究成果 "MultiWaverX: Modeling latent sex-biased admixture history "。

这一工作提出了一种新方法 MultiWaverX,可推断人群性别偏向性混合历史,并应用该方法分析和重构了中亚地区、中东地区以及美洲大陆的 17 个人群的性别偏向性基因交流历史

性别偏向性是一个群体概念,广泛存在于人群基因交流过程中,即特定祖源的男女遗传贡献存在差异。非裔美国人(African Americans)和拉丁裔美洲人(Hispanic Americans or Latino American)为学界熟知的存在性别偏向性混合的人群。

徐书华解释称,美国黑人的产生主要是白人男性与黑人女性的结合,而反过来的组合就相对少很多!这个过程的后果就是:美国黑人的基因库中,黑人的 X 染色体基因比例就要比基因组的平均水平高一些。这与美国的历史和人口变迁情况情况是相吻合的。

性别偏向性混合的研究对了解人群形成和演化历程、理解现代人类遗传差异、以及指导医学研究都有重要的理论意义和应用价值。

徐书华说:" 我们研究性别偏向性,一方面是想通过遗传学数据重构人类历史上发生过的故事,比如,丝绸之路的历史、蒙古西征等历史上的很多事情都并不清楚,通过这一方法,结合史料也许可以重构历史事件;另一方面,也是想弄清楚对当代人群基因构成及其功能、表型效应和医学后果是什么。"

过去,受限于分析方法,人群演化历史上错综复杂的基因交流中存在的性别偏向性长期以来未得到充分研究,特别是一些经历过多次而复杂基因交流历史的人群,曾经发生的不同方向的性别偏向混合往往被忽视。

MultiWaverX 的提出在很大程度上为这些问题的解决提供了新方法和新思路。

这是研究团队在前期提出的算法 MultiWaver 基本模型和方法的基础上进一步发展而来,特别植入了性别偏向性混合历史推断模块。

用遗传学重构人类历史事件,复旦大学徐书华相

其具体算法可以分为以下三个步骤(上图):

(1)基于常染色体的祖先片段长度分布信息,利用最大期望算法(EM algorithm)或二分搜索算法(Binary Search algorithm)估计不同混合模型下混合时间和常染色体混合比例等参数,进而利用似然比检验(Likelihood ratio test)或贝叶斯信息准则(Bayes Information Criterion)选择最优混合模式。

(2)在第一步确定的混合模式下,基于 X 染色体的祖先片段长度分布信息估计 X 染色体的混合比例。

(3)针对每个祖先人群的每波混合事件,结合常染色体和 X 染色体的混合比例计算男性贡献比例,从而判断性别偏向性方向以及程度。

用遗传学重构人类历史事件,复旦大学徐书华相

此外,研究团队依据混合过程中特定祖先人群男性贡献比例的变化趋势,进一步将性别偏向性混合模型归纳为五种(上图):稳定模型(steady model)、增强模型 ( enhanced model ) 、减弱模型(dilution model)、波动模型(turnover model)、抵消模型(cancellation model)。

其中,性别偏向抵消模型最为特殊,性别偏向信号在经历多次方向相反的混合事件后得以抵消。研究团队在分析实际数据时,发现中国西北少数民族哈萨克族是该混合模型的代表人群。哈萨克族主要居住于中国西北地区,其主要遗传成分来自东亚和欧洲祖先人群,且混合比例比在常染色体和 X 染色体水平上均为 60:40,若使用传统方法进行推断,结果均为无性别偏向混合。而通过 MultiWaverX 分析,研究团队发现该人群呈现出早期欧洲男性为主(约 3000 年前),近期东亚男性为主(约 750 年前)的两波性别偏向性混合历史。

现代人类历史进程错综复杂,帝国的兴起与衰败,奴隶贸易与战争,人群的扩张与迁徙都对人群遗传混合产生了深远的影响。

用遗传学重构人类历史事件,复旦大学徐书华相

应用上,研究团队选取全球典型混合人群分布区域,中亚、中东以及美洲大陆为例,分别解析其性别偏向性混合历史,重构了全球人群性别偏向混合图谱(上图)。




上一篇:海南医院中心实验室建设布局工艺SICOLAB
下一篇:【前沿科普】细胞膜仿生修饰纳米粒