文档介绍：万方数据
遗传算法在数字化图书馆数字资源构建中的应用秦小铁吴晓英陈祖琴相关理论谝糯惴ǖ氖肿试垂菇第卷第重庆科技学院学报匀豢蒲О厍炜萍佳г和际楣荩厍近年来,数字化图书馆已得到了广泛的应用。但同时,在用户使用数字化图书馆中的各种数字资源时,存在着诸多问题,如资源利用率低,学习过程不适合个性化学习,资源检索困难和下载时间长等。不同的读者之间存在显著的个性特征差异,而目前的资源库大都不能满足读者个性化、高效率的学习要求¨J萃诰蚣际跤τ糜谑只际楣菔肿源库的建设,可以有效地改变这种状况。遗传算法的基本原理是,为了寻找好的染色体,通过作用于染色体上的基因进而求解问题。该算法要求对所产生的每个染色体逐一进行评价,同时根据适应值来选择合适的染色体,其结果是,使得适应性较好的染色体将会有更多的繁殖机会。在该算法中,首先通过随机方式产生染色体,这些染色体由若群。每个个体由适应度函数赋值一个数值评价,同时选择高适应度的个体参加遗传操作,在该过程中淘汰低适应度的个体,下一代新的种群由遗传操作后的个体集合形成,对该新种群进行下一轮的进化。遗传算法的流程图如图荆据差别应尽可能小,类之间的数据差别应尽可能大,即遵循“最大化类内的相似性,最小化类间的相似性”的原则。数据挖掘应用于资源库建设中的基本操作步骤年遗传算法干个所求解问题的数字编码组成,进而形成初始种聚类聚类是数据挖掘中重要的核心研究内容之一。该方法是将数据项分组成多个簇或者类,类内的数如下:摘要:针对用户在使用图书馆数字化资源时遇到的诸多问题,尝试运用数据挖掘中的遗传算法指导数字资源库的建设,以提高资源库的利用率,满足用户的个性化学习需求。关键词:遗传算法;数据挖掘;数字资源构建;个性化学习中图分类号:文献标识码:文章编号:———图糯惴鞒掏收稿日期:——基金项目:重庆市教委人文社会科学研究项目作者简介:秦小铁,男,河南镇平人,助理馆员,研究方向为人工智能与数据挖掘。·
万方数据
璐伴选择与优化ū贝笱аПǎ:b幔秦小铁,等:遗传算法在数字化图书馆数字资源构建中的应用崛信息,收集读者的特征。可以收集到的信息有:读者的个人身份信息,包括其姓名、民族、性别、年龄、年级、本人受教育程度等;通过罩炯锹枷吕吹亩琳咝形P畔ⅲ热绶梦室趁的次数、停留页面的时间、下载资源的次数等信息、知识点的点击率;读者的个人主观信息,如言、网络调查信息等。行初步加工处理以及组织重构,构建数据仓库,为进一步的数据挖掘提供平台。此过程主要包括清理、集成、转换和约简。通过该步骤,可以建立挖掘治鲇肫拦溃员愣缘玫降氖萃诰蛩到的知识模式进行检验。J侗硎觯源觲数据中挖掘出来的知识模式,用适当的形式将其表现出来,从而达到改善资源库的建设的目的。实例分析在此采用有监督的缃蟹掷唷S于维数巨大,因而在实验中网络训练太慢,