文档介绍:中不包含冀他入已经发袭或撰写过的研究成采,也不包含为获得——独创声明《注:如没有其基霉要特别声骥魏,本拦可塞蚱潆桃嬉翦笞醚换论文中作了明确的说明并表示谢意。工本人声明所量交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均巴在学位论文作者签名:导师签字:签字目期:年签字日期:年月日
摘要的、有效的、有价值的、可理解的模式,进而发现知识,得出事件的趋向和关联,为用本文的研究思路并未局限于具体挖掘算法的设计,而是从挖掘系统本身的构建入手,就如何提高系统的整体性、,首先讨论了数据挖掘和知识发现的基本理论;然后分析了网络信息检索与诰虻奶卣鳎ㄍ诰蚨象的特征、挖掘和知识发现所需的理论和技术,接着研究了多媒体数据挖掘的特点和技术:进而提出了一个基于亩嗝教迨萃诰蛳低车目蚣芙峁鼓P停⒍云涔δ苣?询的优化方案和两种多媒体数据挖掘算法。该模型首先通过多媒体概念检索技术智能化地在上搜索趁妫缓利用异构信息交换技术将多媒体数据保存到构建的媒体特征库中,在从用户查询界面获】.探讨了数据挖掘和萃诰虻幕舅枷牒图际数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识P突蚬嬖的过程。数据挖掘是知识发现中的核心工作,主要研究发现知识的各种方法和技术。诰蚴从试瓷铣槿⌒畔⒒蛑J兜墓蹋墙ù车氖萃诰虻乃枷牒头椒ㄓτ糜赪,从谐槿「行巳さ摹⑶痹诘摹⒂杏玫哪J胶鸵匦畔ⅰ芯苛硕嗝教迨萃诰虻奶氐愫头椒用传统的数据挖掘的模式,文章讨论了如何将半结构化或非结构化的数据转化或映射为结构化的数据,使诰蛳低澈褪菘饨裘芙岷希峁┮桓黾傻男畔⒋砘肪场数据挖掘和知识发现为解决信息量过大而人们无法有效利用的问题提供了叛的解决途径。多媒体挖掘就是从大量多媒体集中,通过综合分析视昕特性和语义,发现隐含户提供问题求解层次的决策支持能力。个基于数据挖掘技术的面向多种莸耐诰蛳低衬P汀进行了详细的分析和设计,设计了媒体特征库中的知识表示方法,并提出了一种联合查得用户的查询要求后,通过向量空间模型进行多媒体信息检索,然后利用相关反馈技术提高信息检索的质量,最后将检索的结果传送给用户。本文主要做了以下几方面的工作:莺投嗝教迨莅虢峁够蚍墙峁够奶氐憔龆薟中多媒体挖掘不能套基于亩嗝教迨萃诰虻难芯山东师范大学硕士论文
岢隽艘桓龌赪的多媒体数据挖掘系统模型,并对模型各部分的工作机理关联规则挖掘算法和模糊神经网络挖掘算法来实现隐含知识的挖掘。特征提取是系统的核心构件,特征提取的好坏对整个系统有着重要的影响,直接关系到整个系统的检索准确度、检索效果和检索速度。两种挖掘算法都能较有效地用于本文设计的模型的知识挖掘,同时也有利于下~步的知识表达和解释。为进一步的多媒体数据挖掘系统具体开发打下了坚实的基础。关键词:数据挖掘,知识发现,嗝教迨萃诰颍教逄卣骺做了详细设计;针对图像数据,设计了较为集成的多媒体数据特征库:设计使用高维度基丁:亩嗝教迨萃诰虻难芯山东师范大学硕士论文
狹。—.甀琤,瑅—.:。琣:,..瓺瑅痶痶
蟭孙,琈,,基,.蟟。瑆:痶.,,.琣.—
国内外研究现状第一章引言课题提出的意义随着信息技术的迅猛发展,现在可以从、数字图书馆、数字出版物中获得越来越多的移媒体数据,人们对信息的需求芷走向多元化和综合纯。对予多媒体数裕,过去大量的研究是效在基于内容的傣息检索的研究方面,在絮哥中程度上解决了信息搜索和倍息资源发现的问题。但越人们将不满足信息存取这个层次,因为信息梭索只能获取识”。为此,需要研究比多媒体信息检索更简层次的新方法,那就避多媒体数据挖掘,帮鞴蚤。多魏客谇唆な囚锎罅慷囫撂迨菁茫芄综台分析视听特性和语义,发现隐含的、有效的、有价值的、可理解的模式,进而发现知识,得密事件的麓向和关联,为嗣户提供闻题求躺层次豹决策支持能力。铡如,在医学上,对于臌院大量姻脑部照片,可以通过聚类分析将同~脑部痰病的照片聚集在一起,用于分析和研究;在气象上,可以将大量的卫星云图按照不同的天气情浣蟹值分撼同一类天气嬉况戆特征,以发琰套弱麴摸式。多媒体数据挖掘是数据挖掘的~个新的研究领域。由于多媒体数据的内容特性润空瓣特漤葶羹亳莞褥黪经等缫话愎叵地痪莶局惺荇涮伢对诓鞫喾缴^辣侣矗灰些常规的数据挖掘方法不能盥接采用,需要研究适合于多媒体数据的新的挖掘方法和技多潆俸羧零帮数摇挖藏技术研究颁域酶不酝避多,大大键进了蘸隧的发袋。过去瓣要褥予实验釉研究环境,丽今天已经处在面向主流商韭用户的复杂工具迅逮涌现的阶瞬前已商不少脑拖低场⑹