文档介绍:南开大学
硕士学位论文
基于CML关系化存储的化学表达式知识库设计与实现
姓名:陈悦彬
申请学位级别:硕士
专业:计算机应用技术
指导教师:王庆人
20090501
摘要迅速累计,将知识信息化成为了必然的趋势。信息化的一个重要的特征就是强大的知识检索功能。在各种检索工具出现以后,人们在浩如烟海的知识面前不本文以信息化在化学教育领域应用的案例一化学学习助手为出发点,阐述了学习助手子系统一化学表达式知识库引擎设计和实现的重点和难点。化学知谑菝枋龇矫娴闹疃嘤诺悖J犊庖嫜≡窳薠作为化学知识的描述语言。但由于诩焖鞣矫娴牟蛔悖丫薪隙嗟难芯拷玐结构模式;9叵的P停檬菘獬墒斓募际踅屑焖鳌5捎贒的复杂性,不利于这种技术的广泛使用。且恢直菵简单的结构模式,并且可以从谌菽嫦蛲频汲鯴结构。本文提出了一种基于慕莨叵祷成涞绞菘庵写娲⒌姆椒ǎ沟靡訶作为数据描述、以另一方面,化学中存在一类特殊的分子式结构信息,对这类信息的检索其实是图的匹配问题。图的匹配本身是一个完全问题,因而分子式的结构匹配人类社会发展到现在已经进入到一个知识大爆炸的时代。为了应对知识的再茫然无措。识库引擎存储和管理了在化学教育中常见的知识信息,其中核心信息为方程式,并提供知识检索功能。关系化数据库存储检索这种优势互补的模式更加容易的应用到各种系统中。是知识库引擎实现的一个难点。本文提出了一种能够完全描述分子式结构的全息特征字符串,使用这种特征字符串可以利用数据库的高效的查询技术来尽可能的提高分子式结构匹配的效率。关键字信息检索,琗关系化,全息特征字符串,结构匹配
”·”甎琑,Ⅱ
图目录图化学知识库的六项功能⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图描述化学方程式的巍图有机分子式结构示例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一图描述分子式结构的部分图腦定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯枋龅腃结构示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图子结构匹配的模式结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图子结构匹配的目标结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图相邻原子同符号、不对称的结构⋯⋯⋯⋯⋯⋯⋯⋯⋯..图⑻卣髯址墒钡亩恿斜浠疽馔肌J浇峁购湍勘杲峁埂图J教卣髯址湍勘晏卣髯址图ü⑻卣髯址乖龅慕峁埂图化学知识库引擎的整体架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..嬖虺槿×鞒掏肌图由嬖蛎枋龃唇ū淼慕峁沽鞒掏肌图根据峁固崛数据的流程图⋯⋯⋯⋯⋯⋯.图全息特征字符串生成准备工作流程图⋯⋯⋯⋯⋯⋯⋯一图全息特征字符串的生成流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图分子式结构查询流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图子结构匹配流程图一⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图子结构匹配流程图二⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图子结构匹配中的一种特殊情况⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图结构完全匹配评测结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一内容目录
图较复杂的分子式结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图子结构匹配评测官能团集⋯⋯⋯...,⋯⋯⋯⋯⋯⋯⋯⋯⋯内容目录
表目录表根据成涞谋淼慕峁埂表特征字符串的生产过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表图所示分子式所有特征字符串列表⋯⋯⋯⋯⋯⋯⋯表含有通配符的特征字符串列表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一表图所示分子式的所有特征字符串列表⋯⋯⋯⋯⋯⋯表系统模块功能列表⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表叵祷闹匾5氖萁峁埂表全息特征字符串生成、匹配所需的关键数据结构⋯⋯..表知识库中的样本类型和数量⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表两种娲⒎绞降牟檠奔浔冉稀表子结构查询时间统计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯Ⅵ内容目录
南开大学学位论文版权使用授权书学位论文作者签名:豫莶沙陑月/;日本人完全了解南开大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。经指导教师同意,本学位论文属于保密,在年解密后适用本授权书。指导教师签学位论文作者签名:解密时年间:月日各密级的最长保密年限及书写格式规定如下:
学位论文作者签名:话埙彬南开大学学位论文原创性声明沙》年‘月多日本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、己公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。
第一章前言第一节研