文档介绍:青岛大学
硕士学位论文
一类学习语言其在生物信息学中的应用
姓名:王贱珍
申请学位级别:硕士
专业:计算机软件与理论
指导教师:周广福
利用计算机处理这些数据成为必然。生物信息学一门综合运用数学、计型。更重要的是,他还证明正则语言‘中的一类一一严格局部可测语高’,与拼接语言善唇酉低巢挠镅的子类一一持续拼接语言等价。这就架起摘要年,发表了一篇论文】,弓肫唇酉低的概念作为限制酶与脱氧核糖核酸饔谩⒔蠨重组的数学模了分子生物学的数学分析与计算机科学中形式语言理论之间的桥梁。近一卜几年,全世界生物学家收集的颂呛怂、蛋拾基酸序列原始数据不断激增,靠人工来处理这样大量的数据显然力不从心,算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义的新兴学科应运而生,飞速发展起来。生物信息学的一个重要内容是序列分析。序列分析中常用的有序列比刘、神经网络等方法。把形式语言运用于序列分析,是一种新的尝试。日本学者曾把持续局部可测语言‘用于恤红蛋白氨基酸序列的谚穑〉很好的实验结果。我们探索把持续局部可测语言‘用于血红蛋白蛄械难鑬别,也获得了不错的实验结果。关键词:局部语言,拼接系统,自动机,红素矗珼序列分析机器学习第
【甒,琧畐。,,。第瑃甀,猻琲,琑琣琧琤,瑃..琻,.:,一珼,
一、国内外研究背景及动态生物绩怠熬狡祭、存褚、营疆与提供。镪疆建立謦黼鏊本生秘嵇惑痒承基爨缀痔剜蓿崽的提取羁分析。氇括蘩函的发现与签定,翔矧掰鬻环麓纪是生会瓣攀兹露伐,氇是绩惫溷妗过去的余年中,全世界的分子生物学家们所收集的原始信息不断激增,国际人类基因组习:年基本完成人类赫因组测序之后,人们的注意力己姨基鞭缀溅毒转爨慰基嚣缀表这豹分鞭,对器自矮结秘写葫戆熬谈涎。翼本与欧茭圈家在这~时代的技术争夺战也拉丌了序幕。本政府和各大制药公司已把精力集中在分析基因结构与功能,研究开发新的潦因疗法与药物等薮医疗按零方覆,决,昏在螽基强绦磊秀究除羧蘧尽全力,楚趣敬美强家。生物信息学是在生命科学的研究中,以计算机科学理论与方法为:具划生物信息进行存储、检索和分析的科学。它怒当今生命科学和自然科学舱最夫藩沿领域之一,鬻辩氆终是嫠纪囊然静学豹核心领域之⋯。从日荷镄畔⒕俚难芯壳榭隼纯矗噬瞎系纳镄畔⒀У难芯縧容,大致色括以下几个方厦:生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统:生物信慰姚在线服务:生物信息可视勖刈ḿ蚁低场卓和各自实验摩测定的相应数据,经越人规模并行计:发现新糕巍秘新以及各秽功熊使点;黎闲簂巾菲编隅区的信息结构分叛,提蹬穗论模型,阐明该区域的熏要生物学功能;速行模式生物究憋基陶组的信息结构分析剃比较研究;利用生物信息研究遗传密码起源、摹嗣组结构的演化、蓥因组空嘲结构与恚坏墓叵狄约盎褡盒诺∮雈锝关系等生物学的重火润题。功能旗因组相关储息分析。包括与大规模蚺因表达谱分析斗“关路ā软磷:研究,基因表达调控网络的掰浚挥牖信息摆关的棱酸、蛋融矮空鹂结构静预渊和谈瑁约暗按hδ茉げ庾醚芯俊一、国内外研究背景殿动态辩”
跑较方法等:镬建⋯窃逶弱予蘩函缝售塞分掇瓣薪方法、赫技术。毯藜弓生黪封’瓣瓣摸羧与设谤;基于黪囊凌鹱蛋白袋弦憨、缳戆褒瑟受芊祜疽属于基础研究,以探爨生物学自然学鑫然规棒<喝危挥主瘢河τ媚蛚究,它生携大分子缝捻攘羧和药物没诗。毽捶棱糖孩黢^擂让胤义姆肿由杓疲坏鞍字士占浣峁鼓D夂头肿由杓疲痪哂胁凰霉δ苡虻复合蛋白质以及连接肽的设计:艇物活性分子的电子结构卜算和设计:纳米物设计‘:旗于峁沟囊┪锷杓频取生物信息分析的技术与方法研究。包括发展有效的能支持大尺度作图与溅事需要豹较磐、数掇疼夔及蓑予数凌痒工爨,诸麴惫予网络等远程逶潺工具;改进现有的理论分析方法,如统计方法、模式识别方法、隐马尔科夫过程方法、分维方法、神经网络方法、复杂性分析方法、密码学方法、多序列复杂系统分析技术、信息系统分析技术等:建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分柝技术。用于解释綦因组的信息,探索炝屑拜娇粘苯峒久渴刍蟊q癖矶蹋惑抛钛芯炕缱和暾鹅嘟崦匚信息刚络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物频男路椒ㄓ胄录际酢瘦愆岛发震孬;慵爰踩乘牍乇H肜嗷蚴鄣。Ⅶ颊唛啡愦痉信息检测技术和基二盒蛄行畔⒀≡癖泶镌靥濉⒁锏募际酰⒂攵参锪利·繁育捆关的数据瘁以及与大分予设计和药物漫计相关的数獬库。生物信息学不仪具有重大的科学意义,且具有巨大的经济效稳。它既静询:多搿究成采可敬较袄或立弹产韭Γ晌獅奔氇缀离麓产赫。生物德惑学的这一特点在现有的许多学科巾几乎是独一无二的。据报译,生物倍息学产:业的审场在年已经达至亿美元,两劐年估计可增陡到亿美元懿上。这是~一笔疆丈酶粥富,经褥政府的萃辱技决策入都不能对她键丽曩:见。美国