数量性状基因定位研究中若干常见问题的分析与



因此,若LAL0的10倍,则LOD=1;如果LAL0的100倍,则LOD=2;如果LA是L0的1000倍,则LOD=3。根据LOD值和LRT值的定义,不难得到它们之间有如下关系:

1.2 检测QTL的可信度和LOD临界值之间的关系是什么?

与其他假设检验一样,QTL作图中的检验也可产生四种结果(图1)。当一个位点上没有QTL,通过测验却错误地判断有QTL存在,称这种现象为假阳性;当一个位点上有QTL,通过测验判断有QTL存在,称这种现象为真阳性;当一个位点上有QTL,通过测验却错误地判断没有QTL存在,称这种现象为假阴性;当一个位点上没有QTL,通过测验判断没有QTL存在,称这种现象为真阴性。假阳性和假阴性是统计测验中的两类错误,犯第一类错误(或假阳性)的概率(α)等于H0为真时被拒绝的概率,即,

α=P{拒绝H0|H0为真}=P{假阳性}/[P{假阳性}+P{真阴性}]。

犯第二类错误(或假阴性)的概率(β)等于H0为假时未被拒绝的概率,即,

β =P{未拒绝H0|H0为假}=P{假阴性}/[P{假阴性}+P{真阳性}]。

对于特定的检验方法而言,在一定的试验精确度下,降低α则会提高β,降低β则会提高α,同时降低α和β的途径是提高试验精确度和增加样本量。犯第一类错误的概率α一般在检验前设定,对一定的检验方法,给定αβ也是确定的。但是除t-测验外,大多数统计假设检验给定α下的β难以用代数解析式表示出来。

表1前5列给出LOD值1.0~5.0时对应的LRT值以及三种自由度下一次检验中犯第一类错误概率,犯第一类错误概率α有时也叫做显著性概率;后4列给出显著性概率0.1~0.0001时对应的LOD临界值。以自由度2为例,LOD=1.30对应的显著性概率为0.05,如果只做一次假设检验,采用这样的LOD临界值就能保证假阳性的概率不超过0.05,即鉴定出的QTL是假阳性的概率低于0.05,或者说鉴定出的QTL为真的概率超过0.95。基于区间测验的QTL作图,一般在基因组内所有染色体上按一定步长逐点检验QTL的存在,而这些检验又不是完全独立的,因此也很难确定一次检验的显著性水平所对应的全局α。例如,如果每次检验均采用临界值LOD=3,当自由度为2时每个扫描位置对应的α近似为0.001,QTL作图需要知道的是全基因组检验后的。由于QTL作图的复杂性,如涉及到多次非独立假设检验,不同物种有不同大小的基因组,不同作图群体有不同的标记数,零假设下似然比检验统计量服从什么样的渐近分布尚无定论,因此难以准确确定LOD临界值对应的一次检验和全局,但一些非参数统计方法已用于给定全局后LOD临界值的确定[11-12]。一般认为采用2~3的LOD临界值可以把全局控制在0.05以内,在显性QTL和互作QTL作图中,似然比统计量有较大的自由度,还可适当考虑采用较高的临界值,如3~4。但通过理论或模拟,进一步明确QTL作图中似然比检验统计量的渐近分布还是必要的,笔者推测渐近分布可能与染色体条数、每条染色体长度、标记密度和QTL遗传效应类型等因素有关。

与所有假设检验一样,采用较高的LOD临界值会更好地控制假QTL的发生,同时遗传效应较小的真QTL却不易被检测出来。如何平衡两类错误的概率,这不仅仅是统计学问题,还要考虑到具体的研究目标。如果QTL作图只是初步确定基因在染色体上的位置,然后根据作图结果构建其他次级群体对检测到的QTL进行精细定位、甚至图位克隆,然后开展转基因工作,这类研究几乎不容许假QTL的发生。此时要适当提高检验QTL时的LOD临界值,保证后续研究中QTL的可靠性。另一方面,如果研究目标是把QTL作图结果用于标记辅助选择聚合育种,这时只有尽可能多地检测出控制育种目标性状的QTL,才能保证对所有控制育种性状的基因进行选择,因此有必要适当降低检验QTL时的LOD临界值,使得遗传效应较小的QTL也有机会被检测出来。此时即使有一些假QTL的存在,也不至于造成很大的损失。

数量性状基因定位研究中若干常见问题的分析与

图1 QTL定位中假设检验的两类错误。阴影部分表示检验统计量LOD值的分布,LOD0表示临界值

表1 3种自由度下不同LOD值对应的犯第一类错误概率()和不同下对应的LOD临界值

数量性状基因定位研究中若干常见问题的分析与

1.3 如何评价不同的QTL作图方法?




上一篇:原理、方法与应用》 许煜泉、白林泉、黄显清、
下一篇:GWAS定位葡萄风味基因