文档介绍:中南大学图书馆数据挖掘
摘要信息技术正从数据处理向数据应用转变,图书馆迫切期望将多年来在数字化建设中形成的数据集进行面向过程、专题的抽取和分析,形成支持决议的分析数据和报表,从而改善图书馆的管理和服务。数据挖掘这一技术下正是为数据从处理向使用转变的技术处理方案。
关键词数据仓库;数据挖掘;分析系统;个性服务;WEB服务
中图分类号G25文件标识码A文章编号1673-9671-042-0028-02
信息技术的发展改变了读者对图书馆资源索取和利用的方法和手段,提出了新的服务要求,图书馆不得不采取新的技术手段来满足或适应读者的需求,图书管理系统在技术自动化、信息处理多元化等方面较以前有了很大的提升,对数据库技术的普遍应用很好地处理了读者在时间、地域限制的问题,方便读者快捷地索取资源。不过读者对信息索取的查准率依然不高,怎样将图书馆的众多信息上升成为读者知识等问题仍然没有处理,甚至变得愈加严重。究其原因是:信息成几何数增加的同时,图书信息管理系统仍然是面向处理的、关注数据的管理,是一个联机事务处理系统,没有从数据使用的角度进行分析和挖掘,实现面向专题的、支持决议的功效的联机分析处理系统,为此我们不但要将计算机在数据管理上发挥作用,更主要是在数据分析、信息服务上表现出高效、快捷的功效。
1图书馆信息服务现实状况
信息、数据、知识的提升过程在信息社会中已被众多机构瞄准,她们的管理和服务正撼动着图书馆信息服务的主体地位,多年来很多IT企业宣告开拓知识服务,建立基于文件服务的知识创新,于是有些人惊呼图书馆将走向没落和消亡,图书馆将被替换,调查表明图书馆的用户群正逐年流失,用户将获取知识的路径转向互联网,依靠搜索引擎。为此,我们不得不审阅图书馆信息管理和服务的现实状况。
信息不虞和信息过剩问题变得越来越严重
信息以数字形式在图书馆界得以应用和普及,数据以比特流在网络中传输和利用,滚雪球似地被用户加工和完善,面对如此众多的数据,怎样找到有用的信息,成为知识,成为信息社会最大矛盾。今天,用户真切地感受到了“信息贫乏”和“数据关在牢笼中”的无奈,奈斯伯特就曾惊呼“We are drowning in information,but starving for knowledge”的精辟论断,这说明信息的数量和用户需求的矛盾越来越突出。
信息用户松散使得我们难以把握用户的需求
1)读者的在跨地域和时间使用图书馆资源、享受图书馆的服务,图书馆提供了诸如留言簿、电子邮件、在线服务、虚拟参考咨询服务、点对点服务等新的服务手段和交流渠道,让我们对她们的需求变得难以掌握,不过每一个服务平台全部产生自己的系统日志,反应用户在目前平台下的利用情况,我们称为日志数据源,过多的数据源增加了数据综合分析统计和报表的难度。2)图书馆在信息化建设中多平台、异构系统的广泛应用,数据孤岛现象越来越严重,我们在面对数字化建设进程中所积累的大量用户访问日志和资源使用日志,我们却束手无策,无法真正获取读者的需求和评价资源的依据,我们急需技术创新。
图书馆带来新的挑战
最主要的理念是以用户为中心,图书馆应本着“以人为本、开放、实用、易用”的经营理念和服务于用户的态度,保持最大程度的中立性,充足整合各类开放资源,来构建一