1 / 7
文档名称:

基因序列分析.docx

格式:docx   大小:93KB   页数:7页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基因序列分析.docx

上传人:BL01 2022/5/16 文件大小:93 KB

下载得到文件列表

基因序列分析.docx

文档介绍

文档介绍:Document number【980KGB-6898YT-769T8CB-246UT-18GG08】
基因序列分析
基因序列分析
核酸和蛋白质序列分析
在获得一个基因序列后,需要对其进行生物信息学分析译得到蛋白质序列,需要进行ORF分析,每个生物信息学分析软件包几乎都带有翻译功能。推荐使用NCBI的ORF Finder()软件或EMBOSS中的getorf()软件。ORF Finder以图形方式,分为正链+1、+2、+3和反链+1、+2、+3六个相位预测ORF;Getorf可指定预测ORF的长度下限和指定预测正反链。进行ORF分析虽然比较简单,但应注意以下几点:
(1)序列的准确性:尤其是通过计算机拼接的序列,需要根据EST和基因组序列进行反复校正。
(2)ORF是否完整:看在ORF上游同一相位是否具有终止码,或者具有起始密码子。
(3)参考Kozak一致性规律,即起始密码子位点符合A/GCCATGG。
(4)不要忽略反义读框。
4、染色体定位根据基因组图谱对序列进行染色体定位和浏览其基因组上下游基因。具体方法为:(1)进行Genomic BLAST搜索。(2)通过“Genome view”观察基因组结构。(3)点击相应染色体区域,通过表意图(ideogram)和相应区域上下游的基因进行精确定位。
5、基因结构分析根据基因的mRNA序列及基因组序列,可以进行基因结构的分析。推荐使用BLAST或BLAT(进行分析。由于真核生物转录后内含子将被剪切,因此将mRNA和基因组进行比对以后,会发现mRNA的每个外显子与基因组序列片断匹配,根据这些片段可以判断外显子的数目和大小。外显子和内含子具体边界的确定,可以参考GT/AG一致性规则。BLAT的结果直接显示外显子数目、大小及边界。
6、基因上游调控区分析
(1)启动子预测:推荐使用冷泉港开发的FIRSTEF程序()进行启动子预测。用RT-PCR等实验方法获得的mRNA往往缺少完整的5’端,采用FirstEF程序可以对第一外显子(尤其是非编码的第一外显子)和CpG相关启动子进行预测。
方法:以FastA格式输入起始密码子上游序列。
(2)转录因子结合位点分析:推荐使用TFSEARCH程序()及MATCH程序
()对转录因子数据库TRANSFAC()进行搜索,寻找可能的转录因子结合位点。
方法:输入起始密码子上游序列。结果将给出很多可能的转录因子结合位点,注意选择其中分值较高的位点。
(二)蛋白质序列分析
1、跨膜区预测
各个物种的膜蛋白的比例差别不大,约四分之一的人类已知蛋白为膜蛋白。由于膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构。因此,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用。
推荐使用TMHMM软件()对蛋白进行跨膜预测。TMHMM综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,采用隐马氏模型(Hidden Markov Models),对跨膜区及膜内外区进行整体的预测。TMHMM是目前最好的进行跨膜区预测的软件,它尤其长于区分可溶性蛋白和膜蛋白,因此首选它来判定一个蛋白是否