文档介绍:该【使用目标基因表达的概率建模评估细胞信号传导途径活性的制作方法 】是由【421989820】上传分享,文档一共【39】页,该文档可以免费在线阅读,需要了解更多关于【使用目标基因表达的概率建模评估细胞信号传导途径活性的制作方法 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。使用目标基因表达的概率建模评估细胞信号传导途径活性的制作方法
使用目标基因表达的概率建模评估细胞信号传导途径活性的制作方法
本申请主要涉及特定方法,其至少基于医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平来推断所述医疗个体的组织中一种或多种细胞信号传导途径的活性;装置,其包含配置以进行此类方法的数字压缩机;和非临时性存储介质,其存储由数字处理设备可执行以进行此类方法的指令。
【专利说明】使用目标基因表达的概率建模评估细胞信号传导途径活性
[0001]本文描述的主题主要涉及生物信息学、基因组处理技术、蛋白质组处理技术及相关技术。
[0002]基因组和蛋白质组分析已经基本上实现了医疗领域诸如肿瘤学中的临床应用,并且是其的潜在希望,其中已知多种癌与基因组突变/变异和/或具体基因的高或低的表达水平的具体组合相关,其在癌的生长和演变(例如细胞增殖和转移)中起作用。例如,fct信号传导途径影响细胞增殖的调节,并且是高度调节的。由于丧失调节而导致的高fct途径活性与癌,其中与恶性结肠肿瘤相关。尽管不受任何具体运行理论的限制,但认为恶性结肠细胞中Wnt途径的去调节导致高
Wnt途径活性,其依次导致恶性结肠细胞的细胞增殖,即结肠癌的扩散。另一方面,例如在骨质疏松症的情况中,异常低的途径活性可能也涉及(ofinterest)。
[0003]获取基因组和蛋白质组数据的技术在临床环境中已经变得容易获得。例如,常规使用通过微阵列的测量来评估基因表达水平、蛋白水平、***化等等。自动基因测序能够成本划算的鉴定DNA和mRNA中的遗传变异。基因测序过程中mRNA水平的定量评估保留了作为另一种评估基因表达水平的临床工具的希望。
[0004]尽管(或,也许,由于)这些进展,但基因组和蛋白质组分析的临床应用面临根本上的障碍——数据过载。例如,单一临床样品中可鉴定的突变的数目可以为成千上万或者更多的数目。这些突变的大多数是所谓的旁观者突变(bystandermutations)而对癌生长并无具体作用,并且仅有少数的确对癌生长和功能演变起作用,并且这些代表了有效治疗的靶标。单一微阵列能够产生数以万计基因的基因表达水平。处理这样大量的数据来鉴定临床上有用的信息,如例如在选择正确疗法的应用中是困难的。
[0005]一种方法是将分析限制为少数规范的或标准化的测试,诸如由美国食品和药物管理局(FDA)认可的测试。在这样的方法中,检测具体指示物或指示物的组合(例如突变和/或特定的高或低基因表达水平)以测试对所指示的疾病病况
(例如癌的具体类型)为“阳性的”。规范测试由临床研究所支持,其已经显示出与疾病病况或与治疗效力密切相关。该方法仅用于已经开发了规范测试的那些临床病况,例如疾病的具体诊断、或预测在具体阶段具体癌类型中对药物的应答,并且由于它仅应用于规范的病况,因此也是精确的。
[0006]另一种方法基于鉴定基因组或蛋白质组指示物的功能相关的组。例如,Wnt途径包含蛋白质组反应的级联。该链的主要组分包括(但不限于)fct信号传导蛋白与细胞的卷曲表面受体的结合,其导致蛋白散乱家族(disheveledfamilyofproteins)的蛋白的活化,其依次影响细胞核中的转录剂诸如基于β连环蛋白/TCF4的蛋白复合物的水平。这些转录剂依次控制目标mRNA分子的转录,其依次翻译为Wnt途径的目标蛋白。临床研究已经显示了Wnt途径的调节蛋白与Wnt途径的活性之间的某些关联。
[0007]然而,将此类临床研究结果应用到具体患者的诊断和临床评价中是困难的,这是由于信号传导途径例如Wnt途径的复杂性。作为简单实例,在fct途径的“上游”的蛋白表达水平的测量可以无法检测在fct途径的“下游”的蛋白的异常行为。认为Wnt途径包括大量反馈机制并且“上游”和“下游”的简单概念可能对于fct途径的本质部分是不适用的;更常见的是,包含fct途径的蛋白级联的一部分中的异常行为可能对蛋白级联的其他部分以及对作为整体的fct途径的活性具有或多或少的影响。还进一步,在某些临床研究中,信号传导级联的调
节蛋白的蛋白表达水平通过测量编码该调节蛋白的基因的mRNA表达水平来评估。这是间接测量,其可能无法准确地评估调节蛋白表达水平,并且甚至难以反映有活性蛋白(在具体的翻译后修饰如磷酸化之后)的量。
[0008]导致产生本发明的主要问题因此是提供分别进行基因组和蛋白质组分析的合适方法和手段。当研究本说明书、本文提供的实施例时,以及具体是当研究所附的权利要求时,与本发明相关的问题以及进一步的缺陷下的具体方面变得明确。
[0009]本发明提供了如本文所公开的新的且改进的方法和装置。
[0010]与本发明的主要方面一致,以上问题通过使用目标基因表达的概率建模来评估细胞信号传导途径活性的具体方法来解决,即包括以下内容的方法:
至少基于在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的表达水平(具体为mRNA和/或蛋白水平)来推断所述医疗受试者的组织中的一种或多种细胞信号传导途径的活性,其中所述推断包括:
通过评价概率模型(优选Bayesian网络)的至少一部分来推断医疗受试者的组织中一种或多种细胞信号传导途径的活性,所述模型对于一组输入表不一种或多种细胞信号传导途径,所述一组输入包括至少在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水
平;
估计医疗受试者的组织中至少一种转录因子(TF)元件(至少一个控制一种或多种细胞信号传导途径的一个或多个目标基因的TF元件)的水平,所述估计至少部分基于与至少一个TF元件和在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平有关的条件概率;和
基于组织样品中转录因子的估计水平来推断一种或多种细胞信号传导途径的活性;和基于医疗受试者的组织中的一种或多种细胞信号传导途径的推断活性来确定在医疗受试者的组织中一种或多种细胞信号传导途径是否运行异常;
其中通过数字处理设备使用一种或多种细胞信号传导途径的概率模型来进行所述推断。
[0011]“一种或多种目标基因”可以是“直接目标基因”和/或“间接目标基因”(如本文所述)。
[0012]优选所述推断包含估计医疗受试者的组织中由概率模型的TF节点所代表的至少一种转录因子(TF)元件的水平,所述TF元件控制一种或多种细胞信号传导途径的一个或多个目标基因的转录,所述估计至少部分基于与代表在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的概率模型中的所述
TF节点和多个节点相关的概率模型的条件概率。
[0013]概率模型可以是Bayesian网络模型。因此,根据优选的实施方案,通过使用Bayesian网络进行推断,所述Bayesian网络包含代表关于一种或多种信号传导途径的信息的节点和Bayesian网络的连接节点之间的条件概率关系。
[0014]一种或多种细胞信号传导途径可以是Wnt途径、ER(雌激素受体)途径、AR(雄激素受体)途径和/或Hedgehog途径。因此,根据优选的实施方案,一种或多种细胞信号传导途径包含Wnt途径、ER途径、AR途径和/或Hedgehog途径。
[0015]具体合适的目标基因描述于以下正文部分以及下文的实施例中(例如见表1-9)。
[0016]因此,根据优选的实施方案,一个或多个目标基因选自包含以下目标基因或由其组成的组:表1或表6中列出的目标基因(对于Wnt途径)、表2、表5或表7中列出的目标基因(对于ER途径)、表3或表8中列出的目标基因(对于Hedgehog途径)以及表4或表9中列出的目标基因(对于AR途径)。
[0017]具体优选的是这样的方法,其中所述推断包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个fct途径的目标基因的表达水平来推断该医疗受试者的组织中
fct途径的活性,所述目标基因选自包含以下或由其组成的组:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、S0X9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和FZD7。
[0018]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个fct途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:NKD1、OAT、FATULEFUGLUL,REGIB、TCF7L2、C0L18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKKl、HNFlA和LECT2。
[0019]具体优选的是这样的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个ER途径的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性,所述目标基因选自包含以下或由其组成的组:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD,TFFl和NRIPl。
[0020]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个ER途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:APlBUATP5J、C0L18A1、C0X7A2L、EBAG9、ESRl、HSPBl、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDMl5,PTMA,RARA,SODl
和TR頂25。
[0021]还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个Hedgehog途径的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,所述目标基因选自包含以下或由其组成的组:GLI1、PTCHl、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXLUCFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXMUGLI3、TCEA2、FYN和CTSLl。
[0022]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个Hedgehog途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:BCL2、F0XA2、F0XF1、G19、HHIP,IL1R2、JAG2、JUP、MIF、MYLK、、、PITRMl和TOMl。
[0023]还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个AR途径的目标基因的表达水平来推断该医疗受试者的组织中AR途径的活性,所述目标基因选自包含以下或由其组成的组:KLK2、PMEPAUTMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRGl、LRIGl、CREB3L4、LCPl、⑶CYIA3、AR和EAF2。[0024]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个
AR途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:APP、NTS、PLAU,CDKN1A、DRG1、FGF8、IGFUPRKACB,PTPNUSGKl和TACC2。
[0025]本发明的另一方面涉及这样的方法(如本文所述),进一步包括:
为医疗受试者推荐开药,所述药物矫正一种或多种细胞信号传导途径的异常运行;其中只有当基于一种或多种细胞信号传导途径的推断活性来确定所述一种或多种细胞信号传导途径在医疗受试者的组织中运行异常时,才进行所述推荐。
[0026]本发明还涉及这样的方法(如本文所述),其包括:
至少基于在医疗受试者的组织的提取样品中测量的fct途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中fct途径的活性和/或
至少基于在医疗受试者的组织的提取样品中测量的ER途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性和/或
至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,