1 / 54
文档名称:

发现表达连接基因的制作方法.docx

格式:docx   大小:66KB   页数:54页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

发现表达连接基因的制作方法.docx

上传人:开心果 2023/3/20 文件大小:66 KB

下载得到文件列表

发现表达连接基因的制作方法.docx

文档介绍

文档介绍:该【发现表达连接基因的制作方法 】是由【开心果】上传分享,文档一共【54】页,该文档可以免费在线阅读,需要了解更多关于【发现表达连接基因的制作方法 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。发现表达连接基因的制作方法
专利名称:发现表达连接基因的制作方法
技术领域:
本发明涉及分子生物学和生物技术领域,更具体地涉及基因组DNA中核酸序列的测序、检测以及鉴定领域。更加具体地说,本发明涉及一种方法在核苷酸序列的鉴定和/或检测中的应用,其中所述核苷酸序列代表基因组中的大部份转录区及其周围区域,并且涉及多种多样的遗传性状、基因和它们的组合。本发明可以用于高通量检测和鉴定来自任何来源,可以是植物、动物、人、人造物或其他来源的分子标记物的领域。
背景技术:
育种技术已从可见性状的简单选择演变成利用分子标记物来检测多基因性状的先进方法。原则上,杂交群体的不同种系之间的每一种遗传差异都能够代表一种改变的性状。然而,由于大多数基因组的复杂性,所以不可能鉴定基因组之间存在的每一种差异并使其关联于特定性状。从理论上讲,对完整的基因组进行测序将揭示基因组之间的所有差异。然而,借助于目前的测序技术,在实践中不可能以时间和成本有效的方式实现上述目的。因此,用于检测遗传差异的方法主要基于复杂度降低的原则,其涉及来自不同个体的有限但完全确定部分的基因组DNA的测序。随着测序技术的发展,对于某些
用途如代表所有表达基因序列的转录物组(tnmscriptome)的分析,复杂度降低已变得不那么重要了。然而,真核基因组的大小(几十至数百的巨碱基(百万碱基,megabase))仍然超过目前高通量测序技术的能力。此外,在真核生物体中,尤其是在那些具有较大基因组的真核生物体中,绝大多数的基因组DNA并不提供对于育种目的有价值的信息,因为它从未被表达,因而对于性状的表达似乎并没有贡献。因此,为了鉴定分子标记物,集中于那些在更大程度上揭示与性状紧密关联的分子标记物的基因组部分的方法优于仅分析来自包括未表达区域的基因组的随机选择的方法。当基因组大小增加时,这个问题就变得更加突出。所描述的方法使得能够确定代表大部份被表达的基因的编码区的基因组DNA的所选部分以及它们周围区域的序列。不同个体之间的上述所选部分的比较使得能够鉴定在已表达基因内部或附近的多态位点。因为在非编码区中多态性的频率更高,所以当使用目前的技术时能够使更多的多态性与表达基因相关。而且还可以对更多保守基因周围的更大非编码区中的多态性的存在进行分析。这会最终导致发现每种性状的至少一种标记物。本发明的方法使得能够通过启示在不同个体和生物体中、甚至是在具有复杂和较大基因组的生物体中的基因组的明确确定部分而集中于在基因编码区和基因调控区中的SNP检测。核苷酸序列多态性(如SNP)被广泛用于构造基因组图谱。在称作遗传作图的
方法中,在将多态性关联于表型以后,上述多态性能够用作标记物辅助育种技术中的标记物从而检测在发育任何阶段的特定表型。通常在基因组DNA中鉴定核苷酸序列多态性。当所有真核生物体的基因组大小远超过能够利用目前的高通量测序技术来分析的核苷酸的数目时,就需要用于复杂度降低的重复性程序来分析整个基因组的选定部分,从而发现在个体之间的能够用于基因组作图的遗传差异。然而,目前使用的复杂度降低方法的统计特性意味着那些方法并不能揭示可以关联于单一表型的在前的(priori)那些遗传差异或是接近于对特定表型有贡献的基因的图谱。出于以下几个原因,目前的技术主要集中于发现单核苷酸多态性(SNP)与任何其他类型的多态性相比,SNP在基因组中存在的频繁更高;SNP能够准确检测纯合等位基因和杂合等位基因;SNP能够应用于高通量用途和许多工业平台,许多工业平台可以在任何所希望的应用规模以较低成本进行SNP检测。就像密切相关个体的保守基因编码区和基因组一样,虽然SNP发现是在发生低水平多态性的情况下会选择的方法,但是由于固有的低水平多态性,利用在密切相关个体中的SNP发现的EST库并不是那么有效。总之,SNP发现方法应理想地揭示物理上关联于感兴趣的性状的所有存在SNP,而不应受到较低水平多态性(当它们存在于基因组的基因编码区中时)的阻碍或受到对基因组序列知识的任何要求的阻碍。因此,需要一种能够可重复地确定基因组
DNA区域中的代表大部份的基因编码区和它们周围区域的相伴序列,而不需要使用先前已知的基因组或转录物组序列的方法。
发明内容
本发明的发明人现已发现一种用于分析生物体的基因组区的方法,该方法包括四个主要部分。第一部分涉及从用于制备小的单链DN***段的所选生物体分离mRNA,该片段具有一种包含亲和标记的衔接子。这些DN***段用于第三部分。在第二部分中,分离来自相同或相关生物体的基因组DNA。使该基因组DN***段化并连接于衔接子分子。在第三部分中,使这些基因组片段与来自第一部分的单链DN***段杂交,并且在此过程中形成的杂交体用于合成DN***段。这些片段将用于第四部分,该部分涉及利用可获得的高通量测序方法之一来对这些片段进行测序。因此,用于鉴定样品中的基因组DNA的所述方法包括以下步骤a)从生物体的组织样品分离和纯化mRNA;b)利用所述mRNA作为模板来合成cDNA;c)可选地使所述cDNA的复杂度降低;d)使所述cDN***段化;e)可选地选择所述片段的大小;f)可选地通过结合于链霉亲和素包裹的亲和珠除去包含多聚腺苷酸的片段;g)抛光cDNA的所述片段;h)所述片段与包含稀有限制酶的识别位点的一种衔接子和包含生物素标记的另一种衔接子连接;i)可选地选择所述片段的大小;
j)所述片段的缺口修复;k)选择包含两种衔接子序列的所述片段;1)对步骤h中描述的所述衔接子序列退火,利用引物来扩增所述片段,其中一种引物与具有稀有限制位点的衔接子互补而另一种引物包含生物素标记;m)使所述片段结合于链霉亲和素包裹的亲和珠;η)利用来自所述片段的相应的限制酶,除去包含所述稀有限制位点的衔接子;ο)通过生物素-链霉亲和素相互作用,从借助于生物素-链霉亲和素相互作用附着于亲和珠的双链DN***段除去未附着于亲和珠的单链,从而产生结合于链霉亲和素亲和珠的DNA的单链;ρ)分离和纯化例如来自步骤a的生物体的基因组DNA;q)所述基因组DNA的片段化;r)可选地抛光所述基因组DNA;s)所述基因组DNA与一种单一类型的衔接子或与两种不同类型的衔接子(优选的)连接;t)将所述基因组DNA解链成单链DNA;u)使来自步骤t)的基因组DNA与来自步骤ο)的在珠上的cDNA杂交;ν)通过洗涤除去未结合的基因组DNA;w)通过聚合酶来延伸所述cDNA-基因组DNA杂交体以产生双链模板;χ)对所述基因组DNA-cDNA杂交体进行PCR;y)通过大小分级,从所述PCR选择大于约100个碱基对的片段;ζ)可选地纯化所述片段;aa)对所述片段进行高通量测序。在另一种实施方式中,该方法被扩展成用于鉴定多态性的方法,包括根据权利要求所述方法的所有步骤并且另外包括来自两个或更多样品的序列数据以鉴定多态性。定义在以下描述和实施例中使用了若干术语。为了提供对说明书和权利要求
(包括给定术语的范围)的明确和一致的理解,提供了以下定义。除非本文另有规定,所使用的所有技术和科学术语都具有与本发明所属领域技术人员所通常理解的相同的意义。所有出版物、专利申请、专利以及其他参考文献的全部内容以引用方式结合于本文。核酸根据本发明的核酸可以包括嘧啶和嘌呤碱基的任何聚合物或低聚物,分别优选为胞嘧啶、胸腺嘧啶、和尿嘧啶,以及腺嘌呤和鸟嘌呤(参见AlbertLlehninger,PrinciplesofBiochemistry,at793_800())。本发明也包括任何脱氧核糖核苷酸、核苷酸或肽核酸成分、以及它们的任何化学变体,如这些碱基的***化、羟***化或糖基化形式等。上述聚合物或低聚物的组成可以是异质或同质的,并且可以分离自天然存在的来源或可以人工合成产生。此外,核酸可以是DNA或RNA、或它们的混合物,并且可以永久或过渡性地以单链或双链形式存在,包括同源双链、异源双链、以及杂交状态。SNP单核苷酸多态性是当基因组中的单个核苷酸(A、T、C、或G)在物种的成员之间(或在个体的成对染色体之间)在特定基因座处不同时所发生的DNA序列变异。SNP是遗传变异的最常见类型。SNP可以在基因的编码序列、基因的非编码区、或基因之间的基因间隔区中。由于遗传密码的简并性,编码序列内的
SNP未必会改变所产生的蛋白质的氨基酸序列。其中两种形式均导致产生相同多肽序列的SNP被称作同义的,而如果产生了不同的多肽序列,则称其为非同义的。因为SNP是进化上保守的,所以它们可以用作数量性状遗传位点(QTL)分析的标记物以及用于关联研究。内含子内含子是基因的非编码部分,其在剪接的过程中被从mRNA前体除去以产生功能mRNA。外显子外显子是被转录到最后的信使RNA(mRNA)分子而不是像内含子一样被从转录RNA分子剪接掉的基因中DNA的任何区域。cDNAcDNA是人造形式的DNA,其利用RNA分子作为模板通过逆转录酶合成。基因组DNA:术语基因组DNA是指DNA来源于“本身”的情况。这意味着,当在自然界被发现时,基因组DNA所具有的序列,例如包括内含子和调控序列。基因组DNA可以来自不同的来源,如染色体,但也可以源自染色体外的来源如线粒体、叶绿体以及质粒。Cot-IDNA:用来确定任何基因组的序列复杂度的技术,包括DNA的变性和复性。通过加热使DNA变性并且这会使氢键解链并使DNA成为单链。如果快速冷却DNA,则DNA仍然是单链。但如果能够使DNA缓慢冷却,则互补的序列将彼此发现并最终再次成为碱基对。DNA重退火(复性的另一术语)的速率是从其分离DNA的物种的函数,也称为“Cot”曲线。具有高Cot值的DNA是高度重复的DNA,而具有低Cot值的DNA仅可获得低拷贝或是唯一的。在该方法中,我们使用Cot值为
1的DNA,其是被富集以用于高度重复DNA序列的总基因组DNA的一部分。标注cDNA序列的标注包括两个步骤。将所获得的序列与如可由(公共)数据库中获得的核苷酸和/或氨基酸序列比较。用于比较目的的序列比对方法在本领域是众所周知的。通常借助于程序来进行这种比较,如由Altschuletal.,1990)描述的NCBI碱基局部对准检索工具(BasicLocalAlignmentSearchTool,BLAST)。该程序可获自若干来源,包括国家生物信息中心(NationalCenterforBiologicalInformation,NCBI,Bethesa,Md.)和因特网(HTTP:///)。该程序比较所鉴定的cDNA/EST(已表达序列标志)序列和数据库中存在的序列,并基于某个评分和概率参数来提供结果。该程序能够选择那些具有所述概率参数的某个预定下限的cDNA/EST序列。然后在第二步骤中为所选择的cDNA/EST序列提供标注(即,连接于数据库中存在的序列)。这种类型的标注被称作“电子标注(electronicannotation)”。成簇术语“成簇”是指通过成对比较两个或多个核苷酸序列并选择相同或类似核苷酸的短或长的延伸的存在来收集具有相似性的序列的集合的构建。如下文将进一步解释的,用于比对核苷酸序列的若干种方法在本领域是已知的。有时术语“装配”或
“序列比对”作为同义词使用。标识符(Identifier)能够被加入到衔接子或引物中或包括在其序列中或用作标
记以提供独特的标识符的短序列。这样的序列标识符可以是不同长度但确定长度的仅用于鉴定特定核酸样品的独特的碱基序列。例如4bp的标签能够获得44=256种不同的标签。典型的实例是ZIP序列,在本领域是已知作为用于通过杂交进行的独一检测的(uniquedetection)常用标签(-140,2000)利用这样的标识符,在进一步处理以后,可以确定PCR样品的来源。在合并源自不同核酸样品的已处理产物的情况下,通常利用不同的标识符来鉴定不同的核酸样品。
测序术语测序是指确定核酸样品(例如DNA或RNA)中核苷酸的次序(碱基序列)。高通量筛选,经常缩写为HTS,是一种用于具体涉及生物学和化学领域的科学实验的方法。通过现代机器人和其他专门的实验室硬件的结合,使得研究人员能够同时有效地筛查大量的样品,更具体地说,这是一种如在本文其他地方所披露的测序技术(来自454LifeSciences,,)。例如,IlluminaSolexa测序方法依靠随机片段化基因组DNA附着于平面的、光学透明表面和固相扩增以产生具有>1千万个簇的超高密度测序流动池,每个簇包含1,000个模板的拷贝/平方厘米。利用通过合成的强的四色DNA测序技术(robustfour-colorDNAsequencing-by-synthesistechnology)
来测定这些模板的序列,其中上述技术采用具有可去除荧光的可逆终止子。这种方式能够确保高精度和避免具有同聚重复序列的人为构造。利用激光激发和全内部反射光学装置来实现高灵敏度荧光检测。限制性内切核酸酶限制性内切核酸酶或限制酶是一种识别双链DNA分子中的特定核苷酸序列(靶位点),并在位于每个靶位点处或在每个靶位点附近剪切DNA分子的两个链的酶。限制片段通过用限制性内切核酸酶消化所产生的DNA分子称作限制片段。通过特定限制性内切核酸酶,任何给定的基因组(或核酸,不论其来源)都将被消化成限制片段的离散集(discreteset)。来自限制性内切核酸酶剪切的DN***段可以进一步用于各种技术并且能够例如通过凝胶电泳加以检测。连接作用由连接酶催化的酶促反应被称作连接作用,其中两个双链DNA分子被共价连接在一起。通常,两条DNA链共价连接在一起,但还可以通过链末端之一的化学修饰或酶修饰来防止两条链中的一条进行连接。在该情况下,共价键连接将仅发生在两条DNA链中的一条中。合成寡核苷酸优选具有约10至约50个碱基并且能够化学合成的单链DNA分子称作合成寡核苷酸。总的说来,这些合成DNA分子被设计成具有独特的或所期望的核苷酸序列,虽然可以合成具有相关序列的分子的家族并且其在核苷酸序列内的特定位置具有不同的核苷酸组成。术语合成寡核苷酸将用来指具有所设计的或所期望的核苷酸序