1 / 28
文档名称:

david使用方法介绍.doc

格式:doc   大小:2,304KB   页数:28页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

david使用方法介绍.doc

上传人:相惜 2020/7/2 文件大小:2.25 MB

下载得到文件列表

david使用方法介绍.doc

文档介绍

文档介绍:DAVID使用说明文档DAVID简介DAVID(theDatabaseforAnnotation,VisualizationandIntegratedDiscovery)的网址是http://david../。DAVID是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。DAVID这个工具在2003年发布,。和其他类似的分析工具,如GoMiner,GOstat等一样,都是将输入列表中的基因关联到生物学注释上,进而从统计的层面,在数千个关联的注释中,找出最显著富集的生物学注释。最主要是功能注释和信息链接。分析工具:DAVID需要用户提供感兴趣的基因列表,在基因背景下,使用提供的分析工具,提取该列表中含有的生物信息。这里说的基因列表和背景文件的选取对结果至关重要。基因列表:这个基因列表可能是上游的生物信息分析产生的基因ID列表。对于富集分析而言,一般情况下,大量的基因组成的列表有更高的统计意义,对富集程度高的特殊Terms有更高的敏感度。富集分析产生的p-value在相同或者数量相同的基因列表中具有可比性。DAVID对于基因列表的格式要求为每行一个基因ID或者是基因ID用逗号分隔开。基因列表的质量会直接影响到分析结果。这里定性给出好的基因列表应该具有的特点,一个好的基因列表至少要满足以下的大部分的要求:包含与研究目的相关的大部分重要的基因(如标识基因)。基因的数量不能太多或者太少,一般是100至10000这个数量级。大部分基因可以较好的通过统计筛选,例如,在控制组和对照组样品间选择显著差异表达基因时,使用的t-test标准:foldchanges>=2&&P-values<=。大部分是上下调的基因都涉及到特定的某一生物过程,而不是随机的散布到所有可能的生物过程中。一个好的基因列表比起随机产生的一个基因列表,应该含有更丰富的生物信息。在同样的条件下,列表具有高度可重复性。高通量数据的质量能够被其他独立的实验证实。以上(2),(3),(6)&(7)是来自上游的数据标准,DAVID会自动检查其余的各项要求,即(1),(4)&(7)。基因背景:在一项研究中,如果一个生物过程不正常,那么通过高通量筛选技术,对该过程共同作用的基因有更大的可能性被选为相关的一组。富集分析正是以此为基础。为检测富集的程度,必须选取一个背景来进行对比。基因背景的选取有一个指导原则,就是必须构建一个足够大的,研究者可能涉及的所有基因的集合。用户使用默认的背景文件(默认为该物种的所有基因),或者是上传一个基因列表文件作为基因背景。DAVID为实现各项功能分析,提供了以下4个分析内容(共6个分析工具):(1)GeneNameBatchViewer这个工具能够实现将基因ID迅速翻译成基因名称,从而给研究者对于基因ID列表一个直观的印象,初步判断基因列表是否符合要求目的。图1中显示了该工具的分析结果,具体说明图1中标注。图1GeneNameBatchViewer的分析结果(2)GeneFunctionalClassification这个工具是GeneNameBatchViewer工具的延伸。由于基因名称并不能显著体现基因的功能,所以我们需要更加有效的功能分类工具。该工具基于它们共同的注释信息,而不是基因名称,采用全新的模糊聚类算法,能够实现将功能相关的基因聚到一起作为一个单元,在生物学网络水平上去研究这些基因群。对聚类结果打分,分值越高,代表该组内的基因在基因列表中越重要。同时还提供了2-DView,以热图形式展现聚类到同一组的基因和该组内各个Term之间的关系。结果见图2,将列表中的基因ID作为聚类对象,将功能相关的基因分组显示。图3是以热图形式展示的gene-term关系。图2GeneFunctionalClassification的分析结果图32-DView展示gene-term关系(3)FunctionalAnnotation该工具是DAVID最核心的分析内容,包含了三个子工具:FunctionalAnnotationChart该工具提供gene-term的富集分析。相比于其他富集分析软件而言,DAVID在该功能上最显著的特点是,注释范围的可扩展性:从最初的GO注释,扩展到现在超过40中的注释种类,包括GO注释,KEGG注释,蛋白相互作用,蛋白功能区域,疾病相关,生物代谢通路,序列特点,异构体,基因功能总结,基因在组织里的表达和论文等。用户可以根据需要选择其中的某些或者所有种类的注释信息。结果中以基因列表中富集的Terms为对象,将信息按照DAVID计算出来的p-value排列,同时链接指向更多的信息

最近更新

体育拼接市公开课获奖教案省名师优质课赛课一.. 5页

2024年二年级语文期中复习教案 25页

仰卧起坐体育市公开课获奖教案省名师优质课赛.. 5页

今天我值日的市公开课获奖教案省名师优质课赛.. 4页

人物面部创意画市公开课获奖教案省名师优质课.. 5页

2024年二年级下册音乐教学计划范文汇编九篇 41页

人教版六年级圆市公开课获奖教案省名师优质课.. 5页

2024年事业辞职报告 15页

五级考级舞蹈市公开课获奖教案省名师优质课赛.. 5页

五年级图形的面积市公开课获奖教案省名师优质.. 4页

五下全英市公开课获奖教案省名师优质课赛课一.. 4页

二元一次方程的应用市公开课获奖教案省名师优.. 5页

九年级化学人教版市公开课获奖教案省名师优质.. 4页

主题研修市公开课获奖教案省名师优质课赛课一.. 4页

东宫百度音乐市公开课获奖教案省名师优质课赛.. 4页

下雨的时候幼儿市公开课获奖教案省名师优质课.. 4页

三年级人教版风筝市公开课获奖教案省名师优质.. 5页

三只小猪中班市公开课获奖教案省名师优质课赛.. 5页

七年级活动课市公开课获奖教案省名师优质课赛.. 5页

一次函数复习市公开课获奖教案省名师优质课赛.. 4页

一年级市公开课获奖教案省名师优质课赛课一等.. 4页

一元二次市公开课获奖教案省名师优质课赛课一.. 5页

《认识蔬菜》中班市公开课获奖教案省名师优质.. 4页

一年级评价方案 4页

《夹竹桃》市公开课获奖教案省名师优质课赛课.. 5页

齿轮泵运动仿真教学设计 4页

鲁美美术教学楼设计图 3页

高中语文教学内容设计 5页

工业机器人毕业设计 36页

魔芋—卡拉胶果冻的生产工艺及质量控制 3页