用于序列饱和诱变(SeSaM)的方法



专利名称:用于序列饱和诱变(SeSaM)的方法
前言受到达尔文自然界进化的启发,已经开发了随机诱变方法以根据我们的需要用于剪裁蛋白质(tailoring proteins)和阐明结构-功能关系(1)。创造遗传水平上的多样性是基因改组(gene shuffling)的辅助工具,因为这可创造导入新突变的机会以使蛋白质适应生物工程方法中的非天然环境。真正随机文库的序列间隔在其性质上并不受在生理条件下对功能预选择的限制。基因改组实验中所用的亲本基因通过在生理条件下功能的自然进化而优化。
在随机诱变方法中,基于基因不准确扩增的易错PCR方法由于其简单性和通用性而最常使用。易错PCR方法可分为3种A)通过使核苷酸浓度不平衡和/或加入二氯化锰以降低聚合酶的保真度的方法(2-4),B)使用核苷酸类似物的方法(5、6),和C)组合方法(A和B;(7))。
详述本发明涉及具有(+)链和互补(-)链的n个碱基对的双链多核苷酸序列(主序列)诱变的方法,其包括步骤(i)产生主序列(+)链的单链片段集合,其中该集合的所有成员具有相同的5’末端并且具有3’末端缺失,从而该集合代表具有n-1、n-2、n-3......个核苷酸长度的(+)链;(ii)在步骤(i)中产生的(+)链的3’末端导入至少一个通用核苷酸或简并核苷酸;(iii)利用(-)链或其片段作为延伸的模板链,将步骤(ii)中产生的(+)链延伸至主序列的全长;
(iv)通过使用步骤(iii)中产生的(+)链作为模板链合成(-)链,从而与主序列相比,在(-)链中前面的通用核苷酸或简并核苷酸位置实现突变。
通用核苷酸是能够与所有四种标准核苷酸配对的核苷酸。例如脱氧肌苷三磷酸(dITP)当掺入多核苷酸链时可与腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶碱基配对。
优选的通用核苷酸是脱氧肌苷、3-硝基吡咯和5-硝基吲哚。
简并核苷酸是可与少于所有四种标准核苷酸配对的核苷酸。优选的简并核苷酸是N6-甲氧基-2,6-二氨基嘌呤(K)、N6-甲氧基-氨基嘌呤(Z)、羟基氨基嘌呤(HAP)、2’-脱氧核糖核苷三磷酸(dyTP)、6H,8H-3,4--二氢嘧啶醇[4,5-c][1,2]嗪-7-酮(P)、N4-氨基胞苷、N4-羟基-2’-脱氧胞苷、N4-甲氧基-2’-脱氧胞苷和8-氧代脱氧鸟苷三磷酸(8-氧代-G)。
具有混杂碱基配对性质的核苷酸类似物指基于在其一个或多个官能团上得到修饰的嘌呤或嘧啶结构(如A、G、C、T)的核苷酸,其能使与多于一种(如与两种、三种或四种核苷酸)的其它核苷酸碱基配对。术语具有混杂碱基配对性质的核苷酸类似物也包括通用核苷酸和简并核苷酸。
本发明的优选实施方案是如以上所述的方法,其中通式p(U)a(N)b*(S)c[TERM]的寡核苷酸,其中p=5’-磷酸或羟基或能形成二酯键的任何化学基团;U=通用或简并碱基;a=0至10000的任意整数,优选1-100;N=四种碱基(A/T/G/C(标准核苷酸))混合物;b=0至100的任意整数,优选1-10;*=可裂解基团,例如硫代膦酸酯(phosphothioate)核苷酸中的硫代膦酸酯键;S=标准核苷酸或核苷酸类似物;c=0至100的任意整数,优选1-10;[TERM]=防止寡核苷酸延伸的染料终止子或任何基团,附加条件是a+b>0,优选>1,更优选>2,用于步骤(ii)中以将通用或简并碱基引入步骤(i)中产生的单链片段集合中。可以是防止上述寡核苷酸延伸的任何基团,优选氢或染料终止子。优选的染料终止子是香豆素、6-FAM、荧光素、荧光-dT、JOE、OregonGreen、ROX、TAMRA或Texas Red-X。
本发明另外一个优选实施方案是根据步骤(i)通过将α-硫代膦酸酯核苷酸,优选dATPαS、dGTPαS、dTTPαS、dCTPαS掺入PCR产物并随后在碱性条件下通过碘裂解硫代膦酸酯键,制备主序列(+)-链的单链片段集合。
根据本发明方法的另外一个优选实施方案是用于步骤(iii)的下列方法从含有主序列的双链质粒开始,用可在主序列(+)-链下游退火的引物合成(-)单链质粒多核苷酸序列。该(-)单链质粒多核苷酸序列与步骤(ii)中产生的(+)-链退火。用(-)-链作为模板延伸(+)-链直至主序列全长。图3显示了该方法。
权利要求中公开了更优选的实施方案。
步骤(i)产生具有长度分布的DNA片段库在第一个步骤中,在标准核苷酸和α-硫代膦酸酯核苷酸的存在下使用生物素化正向引物和非生物素化反向引物进行PCR。α-硫代膦酸酯核苷酸类似于普通核苷酸,只是α-磷酸酯的氧原子被硫原子替代。硫代膦酸酯键对碱性条件中的碘裂解敏感。由于硫代膦酸酯在DNA中随机分布,所以可在单次PCR中产生停在每单个碱基的片段文库。如果两个互补链之间的结合牢固,那么可形成缺口。使用链霉亲合素包被的生物磁珠分离生物素化的片段。然后用DNA解链液(0.1M NaOH)除去非生物素化链和不需要的片段。通过在0.1% SDS溶液中煮沸,可容易地从生物磁珠上释放生物素化片段。图1a显示第一步的图,图1b显示相应的实验数据。
步骤(ii)酶促延伸可以使用两种方法延伸具有通用碱基或简并碱基(图2)的DNA片段。在第一种方法中,末端脱氧核苷酸转移酶已经用于在3’末端掺入多义碱基(通用碱基或简并碱基)。第二种方法需要在DNA片段和“特别的”oligo之间的单链DNA连接。将该“特别的”oligo进行5’-磷酸化以利于连接。用荧光素终止以避免分子内和分子间连接和定量掺入。在该oligo中有3种不同部分1)含有通用碱基或简并碱基的“突变部分”,2)由三个碱基组成的“粘合部分”,其通过在oligo合成中使用等摩尔的A/T/G/C而包括所有64种可能。该部分被设计在随后用于全长基因合成的PCR中帮助退火。通过硫代膦酸酯键将“冗余部分”连接至“粘合部分”,该硫代膦酸酯键允许其被碘法裂解。用ThermoPhage RNA连接酶II(Prokaria)完成ssDNA连接。ThermoPhage RNA连接酶II催化单链DNA或RNA的5’磷酸和3’羟基末端之间磷酸二酯键的依赖ATP的分子内和分子间形成。该酶来源于可感染嗜热真细菌Thermus scotoductus的嗜热噬菌体TS2126。该热稳定酶与来源于噬菌体T4的RNA连接酶同源。同T4RNA连接酶相比,它在ssDNA连接中表现更高的效率。连接效率可通过将荧光素标记的oligo连接至单链DNA模板来确定。连接后,“冗余部分”通过在碱性条件中碘裂解而除去。
步骤(iii)全长基因合成第三步是将延伸的片段延长至全长(图3)。这里,我们使用单链模板以避免野生型扩增。用反向引物合成单链模板。甲基化和半甲基化亲本基因通过Dpn I消化得以除去。该过程类似于QuikChange Site-DirectedMutagenesis(Stratagene),只是仅仅使用一种非诱变引物而不是一对诱变引物。延伸的片段由于互补而与单链模板退火,并延长单链直至全长。该PCR反应中的反向引物仅仅与新合成的全长单链而不是单链模板退火。反向引物结合后,将合成双链全长基因。双链DNA将在一条链中含有核苷酸类似物,在另外一条链中含有标准核苷酸。
如果双链模板而不是单链模板用于该PCR中,我们将观察到反向引物结合它的互补模板,扩增不含有核苷酸类似物的双链DNA。
步骤(iv)核苷酸替代在最后的PCR中,将含有核苷酸类似物的链作为模板以替代具有标准核苷酸的核苷酸类似物(图4)。在限制性消化后,将突变基因克隆入合适的表达载体,在大肠杆菌(E.coli)中转化并表达。挑取随机选择的克隆并在小培养管(5ml;LBamp)中生长。分离的质粒DNA随后进行测序。100个克隆的初步测序结果证实正确的替代,并表明对肌苷预期的偏好性(图5和图6)。
使用SeSaM方法可在1-2天内完成突变文库的制备。SeSaM方法具有下列优点0)能够使用所有20种可能的天然存在的氨基酸饱和序列的每个位置。
0)如果使用真正的通用碱基,那么在突变谱内无偏好性。
0)使用转换偏爱或颠换偏爱的简并碱基可操纵突变谱。
0)通过设计合适的特别oligo可控制突变区的长度。
0)通过用Sp-dATPαS/Sp-dTTPαS/Sp-dGTPαS/Sp-dCTPαS或它们的组合,可以控制片段大小分布。
材料与方法使用的化学品都是分析试剂级或更高品质,可购自Sigma-AldrichChemie GmbH(Taufkirchen,德国)、Applichem GmbH(Darmstadt,德国)或Carl Roth GmbH+Co(Karlsruhe,德国)。pEGFP质粒购自BDBiosciences(Heidelberg,德国)。
在所有的PCR中使用循环变温器(Mastercycler gradient;Eppendorf,Hamburg,德国)和薄壁PCR管(Mμlti-Ultra tubes;0.2ml;Carl RothGmbH+Co.,Karlsruhe,德国)。所有PCR的反应体积总是50μl。(预备步骤I)单链pEGFP制备
对于每次PCR,使用5U Pfu Turbo聚合酶(Stratagene,Amsterdam,荷兰)、0.2mM dNTP混合物(New England Biolab,Frankfurt,德国)、12.6pmol反向引物(5′-GACCGGCGCTCAGTTGGAATTCTAG-3′)以及48.6-54.3ng质粒pEGFP(Miniprep,Qiagen,Hilden,德国)。PCR(1循环的95℃ 30秒,40循环的95℃ 30秒/55℃ 1分钟/68℃ 4分钟)后,加入40U的DpnI,随后于37℃温育3小时。使用NucleoSpinExtract(Macherey-Nagel,Düren,德国;35μl洗脱体积用于200μl的PCR产物)进行产物回收。
(预备步骤2)克隆载体的制备首先在100μl反应混合液中用30U的EcoR I(New England Biolab)消化24.3-27.1μg质粒pEGFP(Miniprep;QIAGEN)。反应混合液在37℃温育3小时。用NucleoSpin Extract(Machery-Nagel;50μl洗脱体积用于100μl反应混合物)纯化线性化的质粒。在50μl反应体积中,4.9-5.6μg线性化的质粒pEGFP用20U Age I(New England Biolab)进行第二次消化。在37℃温育3小时后,双重消化的质粒用NucleoSpinExtract(Macherey-Nagel;35μl洗脱体积用于50μl反应混合物)进行纯化。双重消化的pEGFP用于随后的克隆。
(步骤1)使用dATPαS的PCR对于每次PCR(1循环的94℃ 3分钟,31循环的94℃ 1分钟/59.5℃ 1分钟/72℃ 75秒,1循环的72℃ 10分钟),使用2.5U的Taq DNA聚合酶(Qiagen)、0.2mM dNTP混合物(New England Biolab)、0.2mMSp-dATPαS(Biolog Life Science Institute,Bremen,德国)、12.6pmol 5′-生物素化正向引物(5′-GACCATGATTACGCCAAGCTTGC-3′)、12.6pmol反向引物(5′-GACCGGCGCTCAGTTGGAATTCTAG-3′)以及242.9-271.4ng质粒pEGFP(Miniprep;Qiagen)。
(步骤2)硫代磷酸二酯主链的碘裂解硫代膦酸酯键(phosphothiate bond)通过碘(溶于乙醇中;在PCR管中终浓度2μM)裂解。混合物在室温温育1小时。
(步骤3)不同长度单链DNA片段的制备使用Dynabeads MyOne Streptavidin(DYNAL Biotech,Oslo,挪威)于室温下分离来自正向引物的生物素化DNA片段。50μl的生物磁珠(10mg/ml)用100μl的2×B&W缓冲液(10mM Tris-HCl,pH 7.5;1.0mMEDTA;2.0M NaCl)洗涤两次。将洗过的生物磁珠重悬浮于100μl的2×B&W缓冲液中,并加入100μl裂解的PCR产物。温育20分钟后,将生物素化DNA片段固定于生物磁珠上,并通过100μl的2×B&W缓冲液洗涤以除去碘。在100μl的DNA解链液(0.1M NaOH)于37℃温育10分钟后随后用100μl的DNA解链液和100μl的1×B&W缓冲液洗涤,可释放非生物素化的DNA片段。洗涤过的Dynabead在60μl的0.1%SDS中煮沸,以从固相支持体释放DNA片段。含有DNA片段的上清液立即转入另一个管中。
(步骤4)从洗脱的单链DNA片段除去SDS盐使用NucleoTrap试剂盒(Macherey-Nagel,Düren,德国)进行脱盐。将400μl缓冲液NT2加入100μl洗脱的DNA,随后加入15μl NucleoTrap悬浮液。混合物在室温温育10分钟,并每2-3分钟轻柔振动。然后将样品以10000g离心30秒钟,弃去上清液后,用500μl缓冲液NT3洗涤磁珠。后面的步骤重复一次。沉淀物在37℃风干15分钟,以除去残余乙醇,重悬浮于55μl Tris/HCl缓冲液(5mM;pH 8.5)并为了DNA洗脱在50℃温育5分钟用于DNA洗脱。将悬浮液移入NucleoSpin Microfilter,并以10000g离心30秒以从含有DNA的溶液中分离磁珠。
(步骤5)具有通用碱基的DNA片段的酶促延伸每次延伸反应的总反应体积是50μl。在每次反应中,使用5U末端转移酶(New England Biolabs)、0.25mM CoCl2、0.4μM dITP(AmershamBiosciences Europe GmbH,Freiburg,德国),以及18μl来自步骤4的脱盐DNA。在延伸反应(37℃ 30分钟,并在70℃下加热10分钟失活转移酶)中掺入通用碱基之后,根据QIAquick Nucleotide RemovalKit(QIAGEN;25μl洗脱体积用于50μl反应混合物)方法纯化产物。
(步骤6)全长基因合成对于每次PCR(1循环的94℃ 3分钟,30循环的94℃ 1分钟/59.5℃+0.2℃(每循环增加0.2℃)1分钟/72℃ 3分钟,1循环的72℃ 10分钟),使用2.5U的Taq DNA聚合酶(Qiagen)、0.2mM dNTP混合物(New EnglandBiolab)、13.3μl延伸的DNA片段、20pmol反向引物(5′-GACCGGCGCTCAGTTGGAATTCTAG-3′)以及0.66-0.76μg单链反向模板(预备步骤1)。合成全长基因后,用NucleoSpinExtract(Macherey-Nagel;35μl洗脱体积用于150μl PCR产物)实施纯化步骤。
(步骤7)通用碱基替代对于每次PCR(1循环的94℃ 3分钟,30循环的94℃ 1分钟/52℃ 1分钟/72℃ 75秒,1循环的72℃ 10分钟),使用2.5U的Taq DNA聚合酶(Qiagen)、0.2mM dNTP混合物(New England Biolab)、20pmol正向引物(5′-GACCATGATTACGCCAAGCTTGC-3′)、20pmol反向引物(5′-GACCGGCGCTCAGTTGGAATTCTAG-3′)以及2.5μl全长基因(步骤6)。PCR产物用NucleoSpin Extract(Macherey-Nagel;50μl洗脱体积用于150μlPCR产物)进行纯化。
(步骤8)PCR产物消化在通用碱基取代后,40μl纯化的PCR产物(步骤7)用30U EcoR I(NewEngland Biolab)在37℃消化3小时。然后消化物中加入20U的AgeI(NewEngland Biolab),并将混合物在37℃另外温育3小时。消化产物用NucleoSpin Extract(Macherey-Nagel;25μl洗脱体积)进行纯化。
(步骤9)连接和转化消化的PCR产物(步骤8)和pEGFP克隆载体(预备步骤2)用T4DNA连接酶(Roche,Mannheim,德国)于室温连接1小时,并转化到大肠杆菌XL2Blue(Stratagene,Amsterdam,Netherlands)细胞。在2ml TSS缓冲液(10gPEG 6000;5ml DMSO;0.6g MgSO4;100ml LB)中重悬浮50ml培养液(OD5780.4-0.5)的细胞沉淀以制备感受态细胞。将5μl连接混合物加入200μl等份细胞,随即冰浴20分钟,42℃热激45秒并冰上另外冷却2分钟。加入0.8ml LB后,培养液在37℃以170转/分钟振荡1小时。细胞通过以3000g室温离心2分钟进行收集。弃去900μl上清液,并将细胞温和重悬浮于剩余的100μl上清液中。然后将细胞在LB/Amp平板上接种,于37℃过夜温育。


图1a)步骤(i)产生随机片段大小分布;b)上边和中间凝胶照片在碘裂解之前(左泳道)和之后(右泳道)的PCR产物。下边凝胶照片在不同浓度Sp-dATPαS(位于泳道较低部分)的DNA解链和纯化后DNA片段大小分布。
图2a)步骤(ii)用通用或简并碱基延伸的DNA片段;b)下边左侧的凝胶照片使用末端脱氧核苷酸转移酶,通过在3’末端具有不同浓度的脱氧肌苷的引物延伸的PCR。下边右侧的凝胶照片使用末端脱氧核苷酸转移酶,通过在3’末端具有不同浓度的5-硝基吲哚的引物延伸的PCR。
图3步骤(iii)含有核苷酸类似物的全长基因的合成。
图4步骤(iv)标准核苷酸替代核苷酸类似物。
图5100个随机挑选的克隆的测序结果。
图6100个测序克隆的突变的随机分布参考文献0.Arnold,F.H.,Wintrode,P.L.,Miyazaki,K.and Gershenson,A.(2001)Trends Biochem.Sci.,26,100-106.
0.Cadwell,R.C.and Joyce,G.F.(1994)PCR Meth.App.,2,136-140.
0.Lin-Goerke,J.L.,Robbins,D.J.and Burczak,J.
D.(1997)Biotechniques,23,409-412.
0.Cadwell,R.C.and Joyce,G.F.(1992)PCR Meth.Appl.,2,28-33.
0.Kuipers,O.P.(1996)Meth.Mol.Biol.,57,351-356.
0.Zaccolo,M.,Winiams,D.M.,Brown,D.M.amd Gherardi,E.(1996)J.
Mol.Biol.,255,589-603.
Xu,H.,Petersen,E.I.,Petersen,S.B.and el-Gewely,M.
R.(1999)Biotechniques,27,1102-1108.
权利要求
1.用于具有(+)链和互补(-)链的n个碱基对的双链多核苷酸序列(主序列)诱变的方法,步骤包括(i)产生主序列(+)链的单链片段集合,其中该集合的所有成员具有相同的5’末端并且具有3’末端缺失,从而该集合代表具有长度为n-1、n-2、n-3……个核苷酸的(+)链;(ii)在步骤(i)中产生的(+)链的3’末端导入至少一个通用核苷酸或简并核苷酸;(iii)利用(-)链或其片段作为延伸的模板链,将步骤(ii)中产生的(+)链延伸至主序列的全长;(iv)通过使用步骤(iii)中产生的(+)链作为模板链合成(-)链,从而与主序列相比,在(-)链中前面的通用核苷酸或简并核苷酸位置实现突变。
2.根据权利要求1的方法,其中通过掺入核苷酸类似物并随后在碱性或酸性溶液中裂解制备步骤(i)中的单链片段集合。
3.根据权利要求2的方法,其中核苷酸类似物是α-硫代膦酸酯核苷酸,并且通过碘在硫代膦酸酯键实现氧化裂解。
4.根据权利要求1的方法,其中步骤(ii)包括利用通用碱基或简并碱基通过酶促或化学方法延伸步骤(i)中产生的单链片段集合。
5.根据权利要求4的方法,其中将末端脱氧核苷酸转移酶或DNA聚合酶或DNA/RNA连接酶用于延伸。
6.根据权利要求1的方法,其中将脱氧肌苷、3-硝基吡咯、5-硝基吲哚或具有混杂碱基配对性质的核苷酸类似物用作步骤(ii)中的通用核苷酸。
7.根据权利要求1的方法,其中将N6-甲氧基-2,6-二氨基嘌呤(K)、N6-甲氧基-氨基嘌呤(Z)、羟基氨基嘌呤(HAP)、2’-脱氧核糖核苷三磷酸(dyTP)、6H,8H-3,4-二氢嘧啶醇[4,5-c][1,2]嗪-7-酮(P)、N4-氨基胞苷、N4-羟基-2’-脱氧胞苷、N4-甲氧基-2’-脱氧胞苷和8-氧代脱氧鸟苷三磷酸(8-氧代-G)或具有混杂碱基配对性质的核苷酸类似物用作步骤(ii)中的简并核苷酸。
8.根据权利要求1的方法,其中通式p(U)a(N)b*(S)c[TERM]的寡核苷酸,其中p=5’-磷酸或羟基或能形成二酯键的任何化学基团;U=通用或简并碱基;a=0至10000的任意整数;N=四种碱基(A/T/G/C(标准核苷酸)混合物;b=0至100的任意整数;*=可裂解基团,例如硫代膦酸酯核苷酸中的硫代膦酸酯键;S=标准核苷酸或核苷酸类似物;c=0至100的任意整数;[TERM]=防止寡核苷酸延伸的染料终止子或任何基团,附加条件是a+b>0,用于步骤(ii)中以将通用或简并碱基引入步骤(i)中产生的单链片段集合中。
9.根据权利要求8的方法,其中所述寡核苷酸按这样的方式设计使得在诱变的多核苷酸序列集合中避免(a)终止密码子和/或,(b)破坏二级结构的氨基酸。
10.根据权利要求8的方法,其中所述寡核苷酸按这样的方式设计使得在诱变的多核苷酸序列集合中实现(a)转换突变或(b)颠换突变。
11.根据权利要求8的方法,其中步骤(i)中产生的不与所述寡核苷酸连接的单链片段用外切核酸酶除去。
12.根据权利要求1的方法,其中通过PCR反应实现步骤(iii)中的延伸。
13.根据权利要求1的方法,其中步骤(iii)包括使用在主序列(+)链下游退火的引物从含有主序列的双链质粒合成(-)-单链质粒多核苷酸序列,将该(-)-单链质粒多核苷酸序列与步骤(ii)中产生的(+)链退火,和延伸该(+)链。
14.根据权利要求1的方法,其中步骤(iii)包括在尿嘧啶和标准核苷酸存在下使用与主序列(+)链的下游退火的引物合成含有该主序列的(-)-单链质粒,并在延伸步骤(ii)中产生的(+)链之后,用尿嘧啶糖基化酶消化携带尿嘧啶的(-)单链质粒。
15.根据权利要求1的方法,其中步骤(iii)后使用PCR扩增,以便合成与步骤(iii)中产生的(+)链互补的(-)-链,从而实现携带突变的双链主序列。
全文摘要
具有(+)链和互补(-)链的n个碱基对的双链多核苷酸序列(主序列)诱变的方法,其包括步骤(i)产生主序列(+)链的单链片段集合,其中该集合的所有成员具有相同的5’末端并且具有3’末端缺失,从而该集合代表具有n-1、n-2、n-3……个核苷酸长度的(+)链;(ii)在步骤(i)中产生的(+)链的3’末端导入至少一个通用核苷酸或简并核苷酸;(iii)利用(-)链或其片段作为延伸的模板链,将步骤(ii)中产生的(+)链延伸至主序列的全长;(iv)通过使用步骤(iii)中产生的(+)链作为模板链合成(-)链,从而与主序列相比,在(-)链中前面的通用核苷酸或简并核苷酸位置实现突变。
文档编号C12N15/10GK1860227SQ200480028565
公开日2006年11月8日 申请日期2004年9月30日 优先权日2003年10月2日
发明者U·施瓦内贝格 申请人:巴斯福股份公司




上一篇:针对EGFR /HER2基因20外显子插入突变肺癌新药TAK-788
下一篇:细胞稳定转染后检测方法