1 / 88
文档名称:

使用祖先数据进行基因组分析的方法和系统的制作方法.docx

格式:docx   大小:95KB   页数:88页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

使用祖先数据进行基因组分析的方法和系统的制作方法.docx

上传人:开心果 2023/3/13 文件大小:95 KB

下载得到文件列表

使用祖先数据进行基因组分析的方法和系统的制作方法.docx

文档介绍

文档介绍:该【使用祖先数据进行基因组分析的方法和系统的制作方法 】是由【开心果】上传分享,文档一共【88】页,该文档可以免费在线阅读,需要了解更多关于【使用祖先数据进行基因组分析的方法和系统的制作方法 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。使用祖先数据进行基因组分析的方法和系统的制作方法
专利名称:使用祖先数据进行基因组分析的方法和系统的制作方法
使用袓先数据进行基因组分析的方法和系统交叉引用本申请要求于2007年9月26日提交的美国临时申请60/975,495的优先权,其全部内容通过引用方式结合在此。
背景技术:
%的相似性。但是个体间存在的相对较小数量的DNA变异会导致表型性状的差异,并与许多人类疾病、对各种不同疾病的易感性和对疾病治疗的响应相关。个体间的DNA差异出现在编码和非编码区,并包括在基因组DNA序列中的特定位点上的碱基改变以及DNA的插入和缺失。出现在基因组单个碱基位置上的改变被称为单核苷酸多态性或“SNP,,。尽管SNP在人类基因组中相对罕见,但是它们占个体间DNA序列变异的大多数,在人类基因组中每1200个碱基对会出现大约1次(参见国际HapMap计划,)。随着可获得更多的人类遗传信息,人们逐渐了解到SNP的复杂性。随之,人们发现基因组中SNP的出现与各种疾病和症状的存在和/或易感性相关。随着这些相关性的发现和人类遗传学中的其它进展,医学和个人保健总体上会朝向个性化的途径发展,其中患者特别地根据他或她的基因组信息来进行适当的医疗和其它
选择。有可能影响考虑的一个重要因素为个体的祖先数据(家系)或种族。例如,由于各种可能的原因例如重组率的差异、选择压力或种群瓶颈(bottleneck),不同的群体可具有不同的连锁不平衡模式。因此,如果已对群体A进行了研究而在该群体中获得了与表型相关的遗传变异的特定优势比(oddsratio),并不能在群体B中也假定具有相同的优势比。因此,需要向个体和他们的保健提供者(care-giver)提供个体特定的个人基因组信息(包括祖先数据)以最终提供个性化的医疗和其它决定。
发明内容
本发明提供了用于评估个体表型的基因型相关性的方法,包括a)获得所述个体的遗传样品;b)产生所述个体的基因组谱;C)通过比较所述个体的基因组谱和目前的人类基因型-表型相关性数据库来确定所述个体的基因型与表型之间的相关性;d)向所述个体或所述个体的医疗保健管理者报告来自步骤(c)的结果;e)在附加的人类基因型相关性已知时,用该附加的人类基因型相关性来更新人类基因型相关性的数据库;f)通过将步骤C)的个体基因组谱或其部分与附加的人类基因型相关性相比较并确定个体的附加的基因型相关性来更新个体的基因型相关性;和g)向个体或个体的医疗保健管理者报告步骤f)的结果。本发明进一步提供了评估个体的基因型相关性的商业方法,包括
a)获得个体的遗传样品;b)产生个体的基因组谱;C)通过将个体的基因组谱与人类基因型相关性的数据库相比较来确定个体的基因型相关性;d)以加密方式向个体提供确定个体的基因型相关性的结果;e)在附加的人类基因型相关性已知时,用附加的人类基因型相关性来更新人类基因型相关性的数据库;f)通过将个体的基因组谱或其部分与附加的人类基因型相关性相比较和确定个体的附加的基因型相关性来更新个体的基因型相关性;和g)向个体或个体的医疗保健管理者提供更新个体的基因型相关性的结果。本发明的另一方面为产生个体的表型谱的方法,包括a)提供包括规则的规则集,各规则表明至少一种基因型与至少一种表型之间的相关性;b)提供包括多个个体中的每一个的基因组谱的数据集,其中各基因组谱包括多个基因型;c)定期地使用至少一条新的规则来更新规则集,其中该至少一条新的规则表明之前未在规则集中相互关联的基因型和表型之间的相关性;d)将各新的规则应用于至少一个个体的基因组谱,因而对于该个体将至少一种基因型与至少一种表型相关联;和任选地e)产生包括个体的表型谱的报告。本发明还提供了一种系统,包括a)包括规则的规则集,各规则表明至少一种基因型与至少一种表型之间的相关性;b)定期地使用至少一条新的规则来更新规则集的代码,其中该至少一条新的规则表明之前未在规则集中相互关联的基因型与表型之间的相关
性;c)包括多个个体的基因组谱的数据库;d)将规则集应用于个体的基因组谱以确定个体的表型谱的代码;和e)产生各个体的报告的代码。
本发明还进一步提供了用于评估个体的基因型相关性的方法,包括(a)比较(i)包括与表型相关的遗传变异的第一连锁不平衡(LD)模式和(ii)包括该遗传变异的第二LD模式,其中第一LD模式为第一个体群体的LD模式和第二LD模式为第二个体群体的LD模式;(b)由(a)的比较确定第二群体中遗传变异与表型相关的概率;(c)包括使用步骤(b)的概率,由个体的基因组谱评估所述表型的基因型相关性;和(d)向所述个体或所述个体的医疗保健管理者报告包括步骤(c)的基因型相关性的结果。在一些实施方式中,该方法还进一步包括(e)使用附加的遗传变异来更新所述结果。该概率可为优势比(OR),其中OR可源自已知的OR。例如已知的OR可以为与第一群体的表型相关的遗传变异的0R,例如在科技期刊上公布的对于遗传变异(例如SNP)的OR。在一些实施方式中,第一群体和第二群体具有相似的LD模式。本发明还提供了评估个体的基因型相关性的方法,包括(a)确定第一个体群体中多个遗传变异中的每一个的原因遗传变异概率;(b)确定作为第二个体群体中所述多个遗传变异中的每一个的概率的步骤(a)中的各所述概率;(c)包括使用步骤(b)的概率从个体的基因组谱评估基因型相关性;和(d)向个体或个体的医疗保健管理者报告包括来自步骤
(c)的基因型相关性的结果。在一些实施方式中,该方法还进一步包括(e)使用附加的遗传变异来更新所述结果。已知的遗传变异(例如SNP)可为具有在科技期刊中公布的OR的遗传变异。该概率可为优势比(OR),且步骤(a)的各遗传变异可以接近于与第一群体中的表型相关的已知遗传变异。例如,各遗传变异可与已知的遗传变异连锁不平衡。在此公开的方法和系统的一些实施方式中,基因型相关性作为GCI评分报告。第二群体通常具有不同于第一群体的家系,且所述个体具有第二群体的家系。在一些实施方式中,原因遗传变异是未知的。遗传变异可为单核苷酸多态性(SNP)。本发明的另一方面为以加密或非加密的方式在网络上进行传输,上述的方法和系统。报告可以通过在线入口、通过纸件或通过电子邮件进行。使用的基因组谱可被产生和来自遗传样品。第三方可产生基因组谱、获得遗传样品,或既获得样品也产生基因组谱。遗传样品可为DNA或RNA,且从选自下述的生物样品获得血液、头发、皮肤、唾液、精液、尿液、粪便、汗液和口腔样品。基因组谱可存放在加密的数据库或保险库中。此外,基因组谱可为单核苷酸多态性谱,且在一些实施方式中,基因组谱可包括截短、插入、缺失或重复。基因组谱可通过使用高密度DNA微阵列、RT-PCR、DNA测序或多种技术的组合产生。本发明的方法还包括包含任何HapMap群体(YRI、CEU、CHB、
JPT、ASW、CHD、GIH、LWK、MEX、MKK、TSI)的群体或任何其它的群体,例如但不限于非裔美国人、高加索人、德系犹太人、西班牙系犹太人(S印haradicJewish)、印度人、太平洋岛民、中东人、德鲁兹人、贝都因人、南欧人、斯堪的纳维亚人、东欧人、北非人、巴斯克人、西非人或东非人。通过引用加入本说明书中提到的所有出版物和专利申请均通过引用的方式结合在此,就好像每篇出版物或专利申请均特定地和个别地说明通过引入方式结合在此一样。附图简述
图1为显示本发明的方法方面的流程图。图2为基因组DNA质量控制措施的例子。图3为杂交质量控制措施的例子。图4为来自具有测试的SNP和效应评价的公开文献的典型基因型相关性的表。A-I)表示单个基因座的基因型相关性;J)表示两个基因座的基因型相关性;K)表示三个基因座的基因型相关性;L)为A-K中使用的种族和国家缩写的索引;M)为A-K中的表型名称缩写(ShortPhenotypeName)缩略词的索引、遗传率和遗传率的参考文献。图5A-J为具有效应评价的典型基因型相关性的表。图6A-F为典型基因型相关性和估计的相对危险度的表。图7为示例报告。图8为用于分析和通过网络传送基因组谱和表型谱的系统的示意图。图9为表明本发明的商业方法方面的流程图。图10为示意图,表明所公布的具有特定优势比的CEU(高加索人家系/种族)的SNP不能假定在具有不同的祖先背景的不同群体
(YRI,约鲁巴人家系/种族,参见HapMap
M(.en))中t百同。
具体实施例方式本发明提供了基于存储的个体或个体组的基因组谱来产生表型谱的方法和系统,以及基于存储的基因组谱容易地产生原始的和更新的表型谱的方法和系统。通过从由个体获得的生物样品确定基因型来产生基因组谱。得自个体的生物样品可以是可从中获得遗传样品的任何样品。样品可来自口腔拭子、唾液、血液、头发或任何其它类型的组织样品。然后可从生物样品确定基因型。基因型可以是任何遗传性变型或生物标志物,例如单核苷酸多态性(SNP)、单倍体型或基因组序列。基因型可以是个体的完整基因组序列。基因型可由产生成千或上百万的数据点的高通量分析获得,例如对于大多数或所有已知的SNP的微阵列分析。在另一些实施方式中,还可以通过高通量测序来确定基因型。基因型形成个体的基因组谱。基因组谱被数字化地存储,且方便地在任何时间点访问以产生表型谱。通过应用使基因型与表型相关或关联的规则来产生表型谱。可以基于表明基因型与表型之间的相关性的科学研究来制定规则。该相关性可由一个或多个专家组成的委员会评议(curated)或确定。通过将规则应用于个体的基因组谱,可以确定个体的基因型与表型之间的相关性。个体的表型谱将具有这一确定性。该确定可为个体的基因型
与给定的表型之间的正相关性,从而个体具有给定的表型或将会产生该表型。或者,也可确定为个体不会具有或不会产生给定的表型。在其它的实施方式中,该确定可以是危险因子、估计值或者个体具有或将产生表型的概率。可以基于多种规则进行确定,例如,可以将多种规则应用于基因组谱以确定个体基因型与特定表型的关联。确定过程也可以包括特定于个体的因素,例如种族、性别、生活方式、年龄、环境、家族病史、个人病史和其它已知表型。特定因素的并入可以通过修正现有的规则来包括这些因素。或者,可由这些因素产生单独的规则,且在已应用现有的规则之后应用到个体的表型确定中。表型可以包括任何可测定的性状或者特性,例如对于某种疾病的易感性或者对于药物治疗的反应。可以包括的其它表型是躯体和精神性状,例如,身高、体重、头发颜色、目艮睛颜色、晒斑敏感性、尺码、记忆力、智力、乐观程度、整体性情。表型也可以包括与其他个体或生物体的遗传比较。例如,个体可能对他们的基因组谱与名人的基因组谱之间的相似性感兴趣。他们也可能使他们的基因组谱与其它生物体(例如细菌、植物或其它动物)进行比较。在本发明的另一方面中,组合并分析了关于多种遗传标记与一种或多种疾病或状态的关联的信息以获得遗传综合指数(GeneticCompositeIndex、