文档介绍:摘要完全的初始类进行蛄蟹掷嘟ɑ岬贾吕嗳笔В鱿执砦蟮慕峁一狗在原始蛄兄校嬖谠靥濉⑾拗坪怂崮谇忻浮、榷嘀痔征。根据蛄刑卣鳎诙訣序列集合进行分类的时候,通常是己经知道~定数量的蛄械睦啾穑⒔庑┘褐@啾鸬腅序列作为已标记类的样本,序列集合中余下的序列作为未标记类的样本。这种分类方法通常是基于一个特定的假设:已标记类的样本是完全样本。可是实际情况往往不是这样。根据不时费力。针对这种问题,本论文采用了稻劾嗪鸵矶煞蚰P拖嘟岷系姆椒ǎ对蛄薪辛司劾喾治鲅芯浚淠康氖嵌曰谙嗨剖萏卣鞯腅序列进行聚类和预测。该方法克服了痪岛鸵矶煞蚰P土街炙惴ǖ娜毕荩⒒了各自的优势所在。论文首先是数据预处理,其次,对处理后的数据进行稻劾啵竦靡个粗略的聚类;接着,,获得每一类的隐马尔可夫模型参数;之后,可以应用该概率模型对测试数据或新增蛄薪心P托蛄斜榷裕锏侥P推拦阑蛘咦远劾的目的。聚类分析是蛄蟹治鲋械闹匾Q芯靠翁猓畚牡难芯磕谌菔窃谑笛榈基础上进行的,通过实验,验证了所采用的方法的有效性,具有一定的研究意义,为进一步进行蛄蟹治鲅芯康於嘶关键词:蛄校痪劾啵灰矶煞蚰P
知识水坝为您整理
篍、琣,,—,簍甅痠..瑆,猰..甌.,猰甌,.籹;,籰,。;;
知识水坝为您整理
驭嗣菠年脉度乃。厦门大学学位论文原创性声盼兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明确方式标明。本人依法享有和承担由此论文产生的权利和责任。声明人┟:
:搠蜀力日期:槐C\彳吕月闳琽厦门大学学位论文著作权使用声明本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大学有权保留内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密的C谀杲饷芎笫视帽臼谌ㄊ椤并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位论文的学位论文在解密后适用本规定。本学位论文属于朐谝陨舷嘤ê拍诖颉
第一章绪论研究背景随着人类基因组计划目U梗魑I蒲У暮诵难Э啤!I镄畔终获得所研究生物数据的生物学意义。生物信息学这一交叉学科,已经成为基因新战略,即用表达序列标签这一构想的具体过程是将在体外反转录成后克隆到载体上,构建文库,再从文库中大规模随机挑选克隆,对其嘶’端对蛄薪蟹治觯梢粤私饽程囟ɑ蛟谏锾囟ㄗ橹谋泶锴榭觯有快速、大规模、含信息量多等优点。随着科学技术以及生物信息学的迅猛发展,学也在不断的向前发展。生物信息学是一门交叉学科,它综合运用了以计算机技术为代表的信息学和生命科学的知识来对生物信息进行收集、处理、分析,并最组研究中强有力的必不可少的研究手段】。在人类基因组计划氖凳┕讨校拦⑽郎芯吭,生物学家扔晏岢隽朔⑾直泶锘虻珽寺『投ㄎ恍禄颉进行一步法测序佣竦肊口也可以了解特定组织所表达的基因的种类情况;另外,利用大量的氖荩可以从中发现克隆新的基因,对重要的基因以进行深入研究:而功能基因组的研究,比较基因组的研究,同样需要对蟹治鲅芯俊K酝ü訣的研究与分析,可以得到丰富的信息,同时也是进行各种深入研究的必要条件。因此,对蛄薪蟹治鍪茄芯炕虮泶锏囊恢中兄行У姆椒ǎ际醣亟ê托矶嘈碌姆椒ㄒ黄鸢镏嗣亲钪战铱I陌旅亍随着大规模的测序,表达序列标签莩手甘对龀ぁT诨蚴侗稹基因预测、绘制基因表达图谱、基因功能注释等方面都积累了大量的荨年建立专门的
蛄薪樯经收录了,条蛄。在屑锹剂嗣扛鯡序列的登记号、本文将重点研究劾唷在这一小节中,将介绍蛄械牟珽序列的分析流程,蛄的特征,挠τ玫龋⒍怨谕庋芯肯肿醋髁思蛞5母攀觥布了大规模测序时代的开始。参考图所示,下面是蛄胁谴觕目庵兴婊粞〉囊惶鮟锌寺〉玫降男蛄衅危据库词占捅4嫠械腅数据。战⒌氖焙颍个荩直鹄醋种不同的生物体。到年四月份,数据库已测序引物、碱基序列和文库的来源等详细资料。如何充分利用这些已有的葑试矗又型诰虺鲇杏玫闹J叮哟罅的葜刑崛∮杏玫男畔ⅲ铀偃死嗷蜓芯浚殉晌R桓龈挥刑粽叫缘问题。而劾际跏鞘萃诰蛑兄匾5募际酢蛄械牟由于人类基因数量巨大,以及真核基因特有的复杂性缒诤印⑼庀宰拥区别、重复序列等沟靡淮涡圆患友≡竦囟曰蜃槿ǔそ胁庑虺晌<负醪可能完成的工作。热嗽晏岢隽吮泶镄蛄斜昵技术,宣过程浚菇╟目,即互补且詍D0逶诜醋B济缸用下产生的产物名称。的产生包括以下几个关键过程,如图所示:B基因谢蛐蛄幸约暗骺匦蛄校谝欢ɑ坪吞跫拢蛐蛄斜转录出来成为甿羟投嗑巯佘栈菸于隐马尔可夫模型的蛄芯劾嘌芯.。::///.
瓦付至汔衩忝闼碡星,腪覆薹夏冱覆露弦’仃。;#弧露飘璼,『躊—≥。占隔通过上一步形成的猰心诤屯庀宰羟这个步骤,可以将甿哪诤有蛄幸迫ァM眒’端加上甲基在生物体内,中启始密码子化鸟