【学科发展报德国相机告】生物信息学



差异表达与聚类分析是测序数据下游分析中两个重要步骤,由于测序数据本身存在噪声、测序覆盖度变化范围大、类别样本数可能严重不平衡性等因素,有效、准确地针对测序数据进行差异表达和聚类分析是一个重要的基本问题。复旦大学、中山大学、清华大学、湖南师范大学、西安交通大学等针对差异表达分析中存在的数据噪声大、样本量过小或过大、假阳性率估计不准确、本间不独立等问题,开发了多种新的差异表达分析方法[16-21]。西南财大、北京林大、清华大学、同济大学等采用多种模型与算法,对传统RNA 测序和新兴的单细胞RNA测序数据,分别提出了几种不同应用场景下的聚类方法[22-26]。这些热点领域的算法研究使得我国在相关领域的研究已进入国际前沿。

(二)多组学数据整合与基于测序的遗传学分析

新一代测序技术使人们能从DNA、RNA和蛋白质等多个层次解析癌症等复杂的生物过程,其中多组学数据的有效整合是急需解决的关键问题。最近五年,中科院研究人员通过整合基因组、表观遗传学和转录组特征进行了肿瘤预后分析,得到了预后相关的关键分子特征[27],中南大学、清华大学、中科院、北京大学等通过数据整合分析研究药物与疾病的关系并预测药物响应[28-31],中科院等整合不同数据识别肿瘤生物标记物[32,33],华东师大等通过整合多源数据识别转录过程中的协同作用[34],哈尔滨医科大学、哈尔滨工业大学等对多层次分子信息之间相互关系进行研究,识别肿瘤发生发展过程中核心的调控模块[35-37],清华大学提出一种多组学数据联合快速地降维与可视化分析的方法,为肿瘤分类和聚类提供有效工具[38]。

我国学者提出多个全基因组关联研究(GWAS)相关的生物信息学方法。清华大学提出一种基于疾病—基因相互作用网络,用随机游走算法检测致病基因的方法[39],香港大学提出一种整合GWAS和基因组三维相互作用信息来检测有调控功能的变异的方法[40],哈医大建立了一个关联SNP 和非编码区域的数据库[41],复旦大学建立了通过远端调控解释疾病表型的模型[42],同济大学提出一个整合表观数据和遗传学数据进行调控通路富集分析的方法[43]。伴随着方法学研究,我国在复杂性状表观遗传调控方面也取得多项新发现。

(三)基因网络分析

基因不是相互孤立行使功能的,而是多个基因通过多种转录调控、蛋白质相互作用等形成分子网络,以系统形式行使功能。近年来,我国学者在生物分子网络研究方面取得显著成绩,包括构建基因调控网络、miRNA 调控网络、基因共表达网络,识别网络模块和标志物,分析癌症的分子网络机制等。

在构建基因调控网络方面,中科院上海生科院基于互信息提出了条件相容信息,利用表达谱构建转录调控网络[44];南京中医药大学和香港浸会大学提出了基于贝叶斯网络和吉布斯采样的新工具,整合两种信息推断调控网络[45];北京林业大学利用互信息构建不同环境刺激下的动态调控网络[46];香港大学提出一种基于间隙对齐的表达谱分析方法, 有效构建剪接体特异的基因网络[47];中国台湾新竹清华大学通过eQTLs 推断局部因果关系网络,再通过随机场排序方法构建全局调控网络[48]。在miRNA调控分析方面,同济大学等仅用基因表达谱信息实现癌症中 miRNA- 基因 - 信号通路网络的推断[49];东南大学和南京师范大学通过表达相关性构建转录因子 -miRNA- 基因网络,从系统层次上理解乳腺癌[50];哈尔滨工业大学提出一种假性 3D聚类方法用于识别miRNA 和基因组成的双层网络中的模块[51]。对基因共表达网络,北京大学提出一种基于 F 范数的假设检验方法, 用RNA-seq 数据构建共表达网络[52];复旦大学利用典型相关性分析构建基于外显子等基因组元件的共表达网络[53];南方医大另辟蹊径,尝试了通过文本分析抽取与高频共出现 基因构建基因网络[54]。

在识别网络模块和标志物方面,南京大学将基因信号通路作为一个整体来构建网络, 通过多网络中心分析识别网络中的重要模块,找到关键信号通路[55];上海生科院提出将网络中节点和边互换,识别紧密相连的节点组合作为“边标志物”[56],还提出了通过单个病人的表达谱信息识别动态网络标志物[57];哈尔滨医科大学通过整合多组学数据和蛋白质互作网络,识别变异基因及其下游基因和驱动癌症的关键模块[58-60];上海师范大学与MIT合作,通过细胞系表达相似性和药物响应相似性构建双层网络,预测肿瘤细胞的药物响应[61];中科院数学科学院开发了基于网络稀疏惩罚的部分最小二乘方法,分析基因表达和药物响应的共通模式[62]。

(四)蛋白质组生物信息学




上一篇:2018四川大学华西医院高效液相色谱仪价格医学信息学周小波教授招收
下一篇:对话全球著名生物信息学家李蔚教授:探针温度计生物信息学将在肿瘤精准医疗中日益凸显其核心价值