上海白猪(上系)基因组遗传变异检测与功能注释分



上海白猪是通过十几年的选育而培育成的一个地方肉脂兼用型品种,具有肉质好、产仔数较多、胴体瘦肉率较高和耐粗饲等优良特点。早在1986年被收录至《中国猪品种志》,2012年列入《上海市畜禽遗传资源保护名录》。上海白猪(上系)作为上海白猪的一个品系,曾作为供港猪杜长上杂交组合的母本风靡一时,但随着引进的国外猪种严重地冲击国内种猪市场,上海白猪(上系)的群体规模受到了极大的影响,各项生产指标出现一定程度的衰退,因此需要深入了解当前群体的遗传现状,以便更好地进行提纯复壮与开发利用。

遗传变异的检测和功能注释是分析动物群体遗传现状的重要前提和基础,单核苷酸多态性(SNP)和2 bp~1 kb之间的小片段插入和缺失(InDel)为猪基因组占比最大的两类分子标记。其中,SNP因具备充足的信息常用于基因连锁分析和与动植物DNA功能性变异密切相关的连锁不平衡分析。如H.S.Ai等[-]基于全基因组的SNP遗传标记开展了中国部分地方猪的群体结构和连锁不平衡分析等。M.Z.Li等[]利用重测序得到的SNP标记,从群体遗传学上进一步阐明了藏猪适应高原环境的遗传机理及杜洛克经人工选择后与藏猪遗传上的差异。InDel标记具有较好的稳定性和多态性等优点,频率仅次于SNP,其中约1/3位于已知的基因区域内,还有一些位于决定基因功能的关键性区域如启动子区和外显子区,当前已有多个研究组利用基因芯片开展猪抗病、肉质等相关遗传机制研究[-]。Q.Xiao等[-]也基于基因组简化测序技术(GGRS)开展了地方猪和引进猪的SNP和InDel的检测分析。

本研究针对上海白猪核心群体,采用GGRS测序技术[-],在全基因组范围内进行SNP和InDel等遗传变异多态性检测,并进行系统的功能注释分析,以便了解上海白猪当前群体的遗传现状,进而为其保护和利用提供分子生物学依据。

1 材料与方法 1.1 上海白猪及对照群体

试验所用99头上海白猪的耳组织样采自上海市闵行区畜禽种场的保种群。同时,为了更准确的开展遗传变异的检测分析和缺失基因型的填补,揭示上海白猪的种质特性,本研究采用与其地理位置邻近的中国地方品种(包括6个太湖流域地方品种:梅山猪、二花脸猪、枫泾猪、米猪、沙乌头、嘉兴黑猪)及西方引进品种(包括杜洛克、长白、大白、皮特兰、巴克夏)作为对照品种,共计447个个体。

1.2 简化基因组测序

上海白猪采样个体基于Illumina公司Hiseq2000平台,采用基因组简化测序技术进行双端测序[-]。为了更好的与其它品种进行比较,将上海白猪的测序结果与太湖猪和引进猪种11个品种测序结果[-]在一起进行SNP和InDel calling,缺失基因型的填补则利用Beagle 4.1来完成[-]。最后,分别在全群和上海白猪群过滤掉最小等位基因频率(MAF)小于0.05的SNP位点,用于后续分析。

1.3 基因功能区间分布

猪的基因注释数据来自Ensembl数据库(Ensembl release 78,ftp://ftp.ensembl.org/pub/release-78/gtf/sus_scrofa/)[-],共包含25 332个基因注释信息。根据数据库的信息,本研究主要将基因组区间分为起始或者终止密码子、外显子、内含子、非翻译区(UTR)和基因间区。利用PERL脚本编程语言分析SNP、InDel是否在上述基因组功能区间。

1.4 基因功能富集分析

位于起始/终止密码子区或者外显子区的变异很有可能改变基因的结构和功能。因此,把位于起始/终止密码子区或者外显子区的变异定义为大效应突变。为了进一步了解各类大效应突变显著参与的通路、生物学功能和参与的分子生物学过程,利用DAVID v6.7网络数据库工具及GO和KEGG数据库[-],对这些与大效应突变相关的基因,按突变类型分别进行功能注释(GO annotation)和通路分析(Pathway analysis)。显著性水平P阈值设定为0.05[-]。针对当前猪的GO与KEGG注释库还很不全面的问题,利用PERL脚本提取猪对应的人同源基因标识用于基因富集分析。

1.5 与QTL的映射

猪许多重要性状的QTL已相继被定位,并被收集到猪的QTL数据库(, Release 32, Apr 27, 2017)[-]。截至本研究进行前,该数据库共收集了12 618 QTLs,基于现有的QTL数据库对SNP和InDel等遗传变异进行功能注释分析。针对有些QTLs长度过长,并不能有效地用于后续分析问题,本研究去除了长度超过1 Mb的QTLs,并且把重叠50%以上的两个QTLs合并成一个新QTL,同时设定新QTL与其原始性状都相关。此过程利用QTL的位置信息与性状信息,通过Perl语言脚本处理完成。

2 结果 2.1 上海白猪(上系)基因组碱基测序质量、覆盖度和深度


上一篇:基于线粒体细胞色素氧化酶b (cytb) 全基因序列分
下一篇:转基因是什么意思 转基因意思是什么