1 / 108
文档名称:

模块式dna结合结构域及使用方法 1.docx

格式:docx   大小:108KB   页数:108页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

模块式dna结合结构域及使用方法 1.docx

上传人:开心果 2023/3/21 文件大小:108 KB

下载得到文件列表

模块式dna结合结构域及使用方法 1.docx

文档介绍

文档介绍:该【模块式dna结合结构域及使用方法 1 】是由【开心果】上传分享,文档一共【108】页,该文档可以免费在线阅读,需要了解更多关于【模块式dna结合结构域及使用方法 1 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。模块式dna结合结构域及使用方法
专利名称:模块式dna结合结构域及使用方法
模块式DNA结合结构域及使用方法
技术领域:
本发明涉及通过多肽选择性识别靶DNA序列中碱基对的方法,特异性识别DNA序列中一个或多个碱基对的修饰多肽,被修饰而使它可以被多肽特异性识别的DNA,所述多肽和DNA在特异性DNA靶向中的用途,以及调节靶基因在细胞中表达的方法。
背景技术:
黄单胞菌属(Xanthomonas)的植物病原细菌导致许多重要农作物的严重疾病。所述细菌通过III型分泌系统将一批效应子转移至植物细胞,所述效应子包括大转录激活子样(TAL)/AvrBs3样效应子家族的成员(Kay&BonasQ009)-43,ffhite&Yang(2009)PlantPhysiol,doi:.139360;Schornack等(2006):256-272)。TAL效应子是黄单胞菌属的主要致病因子,含有串联重复序列的中央结构域、核定位信号(NLS)和激活结构域(AD),并用作植物细胞的转录因子(Kay等(2007)Science318:648-651;R6mer等Q007)kience318:645-648;Gu等(2005)Nature435,1122-1125;)
。该效应子家族的类型成员,来自野油菜黄单胞菌辣椒斑点病菌()的AvrBs3,(被AvrBs3上调)(Kay等Q007)Science318:648-651;R6mer等Q007)kience318:645-648;Marois等Q002)-:637-646)。TAL效应子中重复序列的数目和顺序决定其具体活性(Herbers等(1992)Nature356:172-174)。显示重复序列对于AvrBs3的DNA结合是必要的,并且构成新型的DNA结合结构域(Kay等Q007)kience318:648-651)。该结构域如何接触DNA以及什么决定特异性还是未知的。选择性基因表达通过蛋白转录因子与基因调控区内特定核苷酸序列的相互作用来介导。DNA结合蛋白结构域能够区别不同DNA序列的方式在理解诸如分化和发育中控制基因表达的关键过程中是重要问题。特别设计和产生识别预期DNA靶的DNA结合结构域的能力在生物技术中是非常期望的。这种能力可用于开发具有在靶DNA结合时调节基因表达的能力的定制转录因子。实例包括通过设计对预期靶DNA序列特异性的定制锌指DNA结合蛋白而完成的大量工作(Choo等(1994)Nature372:645;Pomerantz等,(1995)kience267:93-96;Liu等,:5525-5530(1997);Guan等(2002):13296-13301
;美国专利号7,273,923;美国专利号7,220,719)。而且,含有设计DNA结合结构域的多肽可用于通过加入DNA修饰结构域来修饰实际靶DNA序列,所述DNA修饰结构域例如多肽内的核酸酶催化结构域。此类实例包括与非特异性核酸酶结构域结合的大范围核酸酶/归巢内切酶DNA识别位点的DNA结合结构域(参见美国专利申请2007/0141038),修饰的大范围核酸酶DNA识别位点和/或来自相同或不同大范围核酸酶的核酸酶结构域(参见美国专利申请公布20090271881),和与具有核酸酶活性的结构域组合的锌指结构域,通常来自IIS型限制内切酶,例如R)kl(Bibikova等(2003)Science300764;Urnov等O005)Nature435,646;Skukla,等O009)Nature459,437-441;Townsend等O009)Nature459:442445;Kim等(1996):1156-1160;美国专利号7,163,824)。目前用于鉴定定制锌指DNA结合结构域的方法采用基于组合选择的方法,利用大的随机文库(通常大小>IO8)以产生具有预期DNA特异性的多指结构域(Greisman&Pabo(1997)kience275:657-661;Hurt等U003)ProcNatlAcadSciUSAlOO:12271-12276;Isalan等Q001)NatBiotechnol19:656-660。此类方法是耗费时间的,有技术要求的,并且可能非常昂贵。用于工程化DNA结合多肽的简单的识别代码的鉴定将代表超过目前用于设计识别预期核苷酸靶的DNA结合结构域的方法的显著进步。发明概述
本发明提供了一种制备选择性识别DNA序列中碱基对的多肽的方法,所述方法包括合成包含重复序列结构域的多肽,其中所述重复序列结构域包含至少一个衍生自转录激活子样(TAL)效应子的重复序列单元,其中所述重复序列单元包含决定所述DNA序列中碱基对的识别的高变区,其中所述重复序列单元负责所述DNA序列中一个碱基对的识别。本发明的这些多肽包含本发明的重复序列单元,并且能够通过模块化方法构建,通过在靶载体中预装配重复序列单元,所述靶载体可以随后被装配成最终目的载体。本发明提供了由该方法制备的多肽以及编码所述多肽的DNA序列和包含这种DNA序列的宿主生物和细胞。本发明提供了通过多肽选择性识别靶DNA序列中碱基对的方法,其中所述多肽包含至少一个包含重复序列单元的重复序列结构域,其中所述重复序列单元各自包含决定所述靶DNA序列中碱基对的识别的高变区。更具体说,本发明人已经确定了DNA结合多肽中负责选择性识别靶DNA序列中碱基对的那些氨基酸。通过阐明识别代码,已经确定了通过多肽中选定氨基酸识别靶DNA序列中特定碱基对的一般原理。本发明发现,作为重复序列单元阵列的一部分的不同长度的不同类型的重复序列单元具有识别一个确定/特定碱基对的能力。在每一个形成重复序列结构域的重复序列单元中,高变区负责靶DNA序列中碱基对的特异性识别。因此,本发明不仅提供了通过包含至少一个包含重
复序列单元的重复序列结构域的多肽选择性识别靶DNA序列中碱基对的方法,还提供了其中可以产生被多肽中的重复序列结构域选择性识别的靶DNA序列的方法。本发明还提供了用于构建识别特定DNA序列的多肽的方法。本发明的这些多肽包含本发明的重复序列单元,并且可以通过模块化方法构建,通过在靶载体中预装配重复序列单元,所述靶载体可以随后被装配成最终目的载体。本发明还提供了用于靶向调节基因表达的方法,通过构建对关注的靶DNA序列特异性的模块式重复序列单元,通过添加所述重复序列单元来修饰多肽以使所述多肽能够立刻识别所述靶DNA,将所述修饰的多肽引入原核或真核细胞并使之表达以使所述修饰的多肽能够识别所述靶DNA序列,并借助这种识别来调节所述靶基因在所述细胞中的表达。本发明还提供了用于靶向修饰靶DNA序列的方法,通过构建包含至少一个识别所述靶DNA序列的本发明重复序列结构域的多肽,并且所述多肽还含有能够修饰所述靶DNA(例如,通过供体靶序列的位点特异性重组、限制酶切或整合)的功能结构域,从而在复杂基因组中实现靶向DNA修饰。本发明还提供包含至少一个包含重复序列单元的重复序列结构域的修饰多肽的制备,其中所述重复序列单元的每一个中的高变区决定靶DNA序列中碱基对的选择性识别。在本发明进一步实施方案中,提供了编码如上所述含有重复序列结构域的多肽的DNA
。在本发明更进一步实施方案中,提供了被修饰以包含位于靶DNA序列中的一个或多个碱基对的DNA,使得所述碱基对的每一个可以被包含具有相应重复序列单元的重复序列结构域的多肽特异性识别,每个重复序列单元包含决定所述DNA中相应碱基对的识别的高变区。在本发明更进一步实施方案中,提供了那些多肽和DNA的用途。还提供了经本发明的分离的核酸分子转化的植物、植物部分、种子、植物细胞和其他非人宿主细胞和由本发明编码序列编码的蛋白或多肽。而且,本文描述的多肽和DNA可以被引入动物和人细胞以及其他生物,例如真菌或植物。总结,本发明关注通过多肽选择性识别靶DNA序列中碱基对的方法,其中所述多肽包含至少一个包含重复序列单元的重复序列结构域,其中每个重复序列单元含有决定所述靶DNA序列中碱基对的识别的高变区,其中连续的重复序列单元对应于所述靶DNA序列中连续的碱基对。
图1TAL效应子的DNA-靶特异性的模型(A)TAL效应子含有中央串联重复序列单元(红色)、核定位信号(NLS)和激活结构域(AD)。AvrBs3的第一重复序列的氨基酸序列。高变氨基酸12和13有灰色阴影。(B)-框共有序列比对。(C)TAL效应子的重复序列单元和诱导基因的启动子中预测的靶序列被人工比对。对应于每个重复序列中高变氨基酸的上部
DNA链中的核苷酸根据以下八个效应子和实验确定的靶基因的组合来计数AvrBs3/Bs3,UPAlO,UPA12,UPA14,UPA19,UPA20,UPA21,UPA23,UPA25,AvrBs3Δrepl6/Bs3-E,AvrBs3Δrepl09/Bs3,AvrHahl/Bs3,AvrXa27/Xa27,PthXol/Xal3,PthXo6/0sTFXl,PthXo7/0sTFIIAy1(参见图5)。占优势的组合(η>4)有灰色阴影。星号表示氨基酸13在该重复序列类型中缺失。(D)重复序列类型基于高变氨基酸12和13的DNA靶特异性代码(R=A/G;N=A/C/G/T)(在该研究中实验证实)。图2Hax2、Hax3和Hax4的靶DNA序列(A)Hax2、Hax3和Hax4重复序列单元的氨基酸12和13和预测的靶DNA特异性(Hax-框)。(B)Hax-框在最小Bs4启动子之前被克隆入⑶S报告载体。(C)Hax效应子对Hax-框的特定诱导性。⑶S报告构建体经农杆菌()分别与!35S-驱动的hax2、hax3、hax4和空T-DNA(-)共递送入本塞姆氏烟草()(误差棒指示SD;η=3个样品;4-MU,4-***-伞形***).35S::uidA(+)用作对照。叶盘用X-Gluc(5-溴-4-***-3-吲哚基-β-D-葡糖苷酸)染色。
图3重复序列类型的DNA碱基对识别特异性(A)Hax4-和ArtX-框-衍生物在最小Bs4启动子之前被克隆入⑶S报告载体。(B)NG-,HD-,NI-和NS-重复序列单元的特异性。Hax4_框衍生物的Hax4_诱导性在重复序列类型靶碱基中完全变化(灰色背景)(C)NN-重复序列单元的特异性。人工效应子
ArtXl和预测的靶DNA序列。ArtXl框衍生物的ArtXl-诱导性在NN-重复序列靶碱基中完全变化(灰色背景)。(D)人工效应子ArtX2和ArtX3和衍生的DNA靶序列。(E)人工效应子对ArtX-框的特定诱导性。(A)-(E)GUS报告构建体经农杆菌分别与!35S-驱动的hax4、artXl、artX2或artX3和空T-DNA(-)—起共递送入本塞姆氏烟草。35S::uidA(+)用作对照。叶盘用X-Gluc染色。关于定量数据,参见图11。图4最小数目的重复序列单元是转录激活所需的。(A)具有不同数目(-)的HD-重复序列单元的人工ArtHD效应子()。(B)由TA和17C组成的ArtHD靶框在最小Bs4启动子之前被克隆入⑶S报告载体。(C)通过具有不同数目的重复序列单元的ArtHD效应子的启动子激活。35S-驱动的效应子基因或空T-DNA(-)经农杆菌与GUS-报告构建体一起共递送入本塞姆氏烟草(误差棒指示SD;n=3个样品;4-MU)。35S::uidA(+)用作对照。叶盘用X-Gluc染色。图5诱导基因的启动子中DNA靶序列与TAL效应子重复序列单元的高变氨基酸12和13的比对。(A)AvrBs3、AvrBs3Δrepl6>AvrBs3Δrepl09禾口AvrHahl的重复序列单元与辣椒ECW-30RBs3基因(访问EU078684)的启动子中UPA-框比对。AvrBs3Δrepl6和AvrBs3Δr印109是AvrBs3的缺失衍生物,其中分别缺失重复序列单元11-14和重复序列单元12-14。AvrBs3、
AvrBs3Δr印109和AvrHahl而非AvrBs3Δrepl6在ECW-30R植物中诱导HR。(B)AvrBs3、AvrBs3Δrepl6>AvrBs3Δrepl09禾口AvrHahl的重复序列单元与辣椒ECffBs3-E基因(访问:EU078683)的启动子中UPA-框比对。AvrBs3Δr印16而非AvrBs3、AvrBs3Δr印109或AvrHahl在辣椒ECff植物中诱导HR。(C)AvrXa27的重复序列单元与稻米)Ca27基因的启动子中推定靶序列比对。Xa27(访问AY986492)由稻米栽培品种IRBB27中的AvrXa27诱导,导致稻米栽培品种顶对中的HR而非xa27(访问AY986491)。(D)PthXol的重复序列单元与稻米)(al3/0S8N3基因的启动子中推定靶序列比对。Xal3(访问DQ421396)由稻米栽培品种顶对中的PthXol诱导,导致稻米栽培品种IRBB13中的敏感性而非xal3(访问:DQ421394)。(E)PthXo6的重复序列单元与稻米OsTFXl基因(访问AK108319)的启动子中推定靶序列比对。OsTFXl由稻米栽培品种顶对中的PthXo6诱导。(F)PthXo7的重复序列单元与稻米OsTFIIAγ1基因(CB097192)的启动子中推定靶序列比对。OsTFIIAυ1由稻米栽培品种IR24中的PthXo7诱导。
(A)-(F)DNA序列上方的数字指示距编码区中第一个ATG的核苷酸距离。不符合我们预期的靶特异性的重复序列/碱基组合(氨基酸12/13=NI=A;HD=C;NG=T;NS=A/C/G/T;NN=A/G;IG=Τ)以红色显示。具有未知靶DNA特异性的重复序列单元以绿色显不。图
6AvrBs3Ar印16保护的DNA区比AvrBs3短4bp。AvrBs3和AvrBs3Δrepl6的DNA酶I足迹分析概述(参见图7,8)。(A)分别由AvrBs3和AvrBs3Δrepl6保护的Bs3(上)和Bs3_E(中)启动子序列。DNA酶I足迹揭示了AvrBs3保护的Bs3启动子的有义链37个核苷酸和反义链36个核苷酸,和AvrBs3Δrepl6保护的Bs3_E启动子的有义链30核苷酸和反义链32核苷酸。UPA-框和预测的AvrBs3Δrepl6-框加下划线。AvrBs3和AvrBs3Δrepl6保护的UPA20-ubm_rl6(下部)启动子序列。UPA20-ubmrl6启动子是具有2bp取代(GA至CT,粗斜体)的UPA20启动子衍生物,所述取代导致被AvrBs3和AvrBs3Δrepl6两者识别。DNA酶I足迹揭示,有义链35个核苷酸和反义链;34个核苷酸被AvrBs3保护(UPA-框加下划线),有义链31个核苷酸和反义链32个核苷酸被AvrBs3Ar印16保护(AvrBs3Δr印16-框加下划线)。绿色(AvrBs3)或红色(AvrBs3Ar印16)阴影的DNA区分别指在每个实验中由AvrBs3和AvrBs3Ar印16保护的核心足迹,甚至具有低蛋白量(等摩尔的DNA和蛋白二聚体)。灰色阴影的DNA区指在所有4个实验中在所有蛋白浓度下不受给定蛋白保护的核苷酸。请注意,AvrBs3-和AvrBs3Ar印16-保护区的5'端是相同的。垂直虚线指示AvrBs3_和AvrBs3Δr印16-保护的启动子区的3'端之间的差异,确证我们的模型一个重复序列与