文档介绍:基于元组匹配和锚特征的菘夥掷嘌芯姓江苏大学二。一三年六月
喜;定嫦昕记希畓手学位论文版权使用授权书咽孙砂江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期刊馀贪缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致,允许论文被查阅和借阅,同时授权中国科学技术信息研究所将本论文编入《中国学位论文全文数据库》并向社会提供查询,授权中国学术期刊馀贪电子杂论文的公布ǹ授权江苏大学研究生处办理。哆如电子杂志社有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、志社将本论文编入《中国优秀博硕士学位论文全文数据库》并向社会提供查询。本学位论文属于不保密口。指导教师签名:田叩,月年签耆作沦学、,
宙甲知独创性声明≯菽辍禄或集体已经发表或撰写过的作品成果,也不包含为获得江苏大学或其他教育机构本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中己注明引用的内容以外,本论文不包含任何其他个人的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:
摘要江苏大学硕士学位论文库中数据信息的一种有效方式,但是由于菘馐糠倍嗲疑婕安煌菁上低持械墓键技术,其中首要的任务是实现数据库的分类,而菘獾谋镜厥油迹虼耸迪諨檠覧姆掷嗉纯墒迪数据库的分类。本文使用掷喾绞蕉訢檠涌诮檠涌谥械牟檠J揭曰袢〔檠涌谥菘夥掷喾椒ǎ岢龌诿L查询接口模式抽取方法。首先给出查询接中与脚本语言相关的定义,并对查询接口的源代码进查询接口转化为标签序列,接着将该标签序列进行优化,结合标签中的粜灾担玫奖察和统计,构建查询控件相关的关联规则,并据此对件对应的条件模式进行形式化表示,进而结合查询控件以及属性标签对应的实例构建查询条件,最后将菘夥掷喾椒āJ紫冉ú檠涌谥械奈谋拘息分为属性标记词、属性实例标记词以及噪音文本信息,使用基于关联规则的檠涌谀J匠槿》椒ǖ玫讲檠涌诙杂Φ哪J叫畔ⅲ⒊槿∑渲械氖粜员记词和属性实例标记词,进而使用属性集合、属性实例集合、,〔⒗猛蛭系淖杂煞植嫉腄域,因此按领域对数据库分类集成成为檠涌是分类,首先基于关联规则抽取的信息,据此提出基于元组匹配的征的菘夥掷喾椒ǎ佣迪諨数据库的分类。具体内容如下:诠亓9嬖虻腄行分析,使用五元组重新表示其中的标签,进而将签对应查询控件之间的位置关系,通过对查询接口中查询控件之间位置关系的观檠涌谥胁檠甧檠涌诘牟檠J正文称之为模式表示成查询条件的集合。,在此基础上使用特定领域的查询接口集合构建领域查询接口,,并结合标记词,构建领域查询接口
关键词:荒J匠槿。皇菘夥掷啵辉W槠ヅ洌幻L卣基于元组匹配和锚特征的菘夥掷嘌芯对应的特征四元组集合以及待分类查询接口对应的特征三元组集合,通过元组匹配得到待查询接口与领域查询接口的匹配度,最后根据匹配度的大小确定分类结诿L卣鞯腄数据库分类方法基础上,提出基于锚特征的甧菘夥掷喾椒āJ紫却犹定领域的查询接口集合中获取该领域内的锚特征集合。对于待分类查询接口,则征集合匹配成功,则完成分类;否则建立待分类查询接口对应的特征三元组集合以及特定领域对应的特征四元组集合,之后基于元组匹配对待分类查询接口进行果。数据库分类方法。在基于元组匹配的首先抽取其中的文本标记词集合,如果该文本标记词集合与特定领域对应的锚特分类。
江苏大学硕士学位论文琤,,珼,.琭琾,,琧,.瑆。,,,.,
籑琺狹;基于元组匹配和锚特征的菘夥掷嘌芯琣,.琣篋;;瓼,,琣,—琧猰琣,籵,琣—琧瓺瑃,
目录江苏大学硕士学位论文论文的研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..菘獾姆掷唷第二章檠涌谀J匠槿檠涌诜治觥相关知识简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.涌谀J匠槿檠涌诘墓亓9嬖颉檠涌诘某槿本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯檠涌诘哪J匠槿本文的研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.檠涌诘淖槌伞基于关联规则的实验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯特征选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯查询接口模型⋯⋯⋯⋯⋯⋯⋯⋯⋯