文档介绍:实验三:基因序列分析杜娟dujuannx@基因与蛋白质组学数据分析实验项目三:基因序列分析一、实验目的和要求:掌握基因可读框的识别;掌握启动子区域的预测掌握CpG岛的预测掌握转录终止信号的预测采用mRNA序列预测基因:Spidey的使用掌握各预测服务器结果的分析*原核生物基因结构1长开放阅读框2高基因密度3简单的基因结构4基因组中GC含量变化非常大特点:*真核生物基因结构特点:1基因结构复杂2具有复杂的基因转录调控方式3具有丰富的可变剪接4有明显的CpG岛、密码子使用具有偏好性*基因组序列分析*例:WhatisGenePrediction?GivenanuncharacterizedDNAsequence,findout:??TAATGCgene1gene2gene3exonintergenicregionintron***一开放读码框的识别开放读码框(openreadingframe,ORF)是一段起始密码子和终止密码子之间的碱基序列ORF是潜在的蛋白质编码区基因预测*基因开放阅读框/基因结构分析识别工具Getorf://.gov/gorf/://、拟南芥、玉米GeneFinderhttp://rulai./tools/genefinder/Zhanglab人、小鼠、拟南芥、:///genomes/MICROBES/.htmSoftberry病毒Generation+.htmSoftberry原核GenomeScan、拟南芥、玉米GeneWise/Wise2/EBI人、蠕虫GRAIL、小鼠、拟南芥、果蝇*