文档介绍:南开大学
硕士学位论文
数学公式结构分析系统设计与关键方法研究
姓名:肖萃
申请学位级别:硕士
专业:计算机软件与理论
指导教师:史广顺
20090501
摘要数学公式图像的自动识别与理解,是文档图像处理与模式识别领域的世界级难题。数学公式是非常复杂的一种文档结构,难以被计算机进行自动处理。对数学公式文档图像进行精确地识别和理解的方法研究,具有广泛的应用价值和学术价值。这也是文档图像识别理解领域的一个重点和难点问题。随着数学公式图像识别领域研究的不断深入,结构分析系统的模型已经基本成熟。目前,以句法分析为驱动、结合版面和语法分析的结构分析流程正在被本文就是在此基础之上,在研究和改进结构分析系统的同时,提出了基于多层次基准线的结构分析方法,极大地减少了结构分析过程中搜索和判定的次数,优化了分析系统流程和效率。同时,本文重点着眼于结构分析子模块的关键技术的研究和评测,首次完整的研究和描述了版面结构分析、语法结构分析、和句法结构分析模块中的一系特殊文档图像理解的评测是一个重要且困难的问题。本文给出了数学公式图像结构分析的评测参数和评测方法,并对本文所提出的系统进行了定性分析。本文中实现的系统具有完备性和容错性,可以适应科研人员乇鹗鞘Я域的科研人员允Ч酵枷竦拇硪G螅哂泻芨叩挠τ眉壑怠关键词:数学公式句法结构分析语法结构分析版面结构分析句法结构树结广泛的研究和使用。列关键技术和处理方法。构分析评测
,,,,..
图目录图符号中心线调整前后位置对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图不平衡分式表达式示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图数学公式图像自动处理过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图数学公式图像处理三个层次的关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图基准线与核心骨干线⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯啾泶锸桨婷娣段А图数学公式句法结构模型组成⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图利用语法规则确定字符属性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图语法规则确定操作符的作用域和组合关系⋯⋯⋯⋯⋯⋯⋯.图利用句法规则进行优先级结构比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图数学知识库结构模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图公式结构行与语义行⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图基于多基准线的句法结构分析过程描述⋯⋯⋯⋯⋯⋯⋯⋯.Ч浇峁狗治龉ぷ髂P汀允鹘峁菇蟹治龅闹骺亓鞒獭图峁狗治鱿低臣芄雇肌图西文字体结构及术语示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图数学公式骨干区域示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图包含复杂下标表达式示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一图复杂指数表达式示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图骨干线提取流程设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图根式外接矩形位置调整⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。图定界子表达式合并示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图
图ɑ直泶锸降淖楹瞎叵凳纠锓ü嬖蛑傅嫉谋泶锸酱矸椒ā图颖泶锸角蚴疽狻图潜旯叵道嘈褪纠图潜旯叵蹬卸ê头治隽鞒掏肌潜昵蚧质疽馔肌阉魉惴ā浞ń峁故鞯穆呒峁辜笆迪纸峁埂图僮鞣坷嘈腿范ㄗ颖泶锸接蚴纠图颖泶锸骄浞ㄊ鹘峁故纠图焦歉刹愦谓峁故疽馔肌图浞ń峁故鞯南晗咐┱构獭图锓ü嬖蚨宰址侗鸫砦蟮男Q椤图锓ü嬖蚨宰颖泶锸绞鹘峁沟男Q椤图数学公式版面复杂度计算示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一图不同重现方式的形式⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图句法树结构与呈现型的映射关系⋯⋯⋯⋯⋯⋯⋯⋯图图目录
表目录表数学公式文档的层次结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表子表达式分类示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表数学公式版面类型示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表定界表达式组合关系类型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表啾泶锸讲僮鞣淖楹戏绞健表操作节点中间状态及处理方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表样本集符号统计情况⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表实验样本集评测结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..
珈甓南开大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:日
学位论文作者签名:暂葬南开大学学位论文版权使用授权书抄暾荚拢日同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国的的前提下,学校可以适当复制论文的部分或全部内容用于学术活经指导教师同意,本学位论文属于保密,在年解密后适用本授权书