1 / 64
文档名称:

潜在语义分析在互联网数据挖掘中应用和研究.pdf

格式:pdf   页数:64页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

潜在语义分析在互联网数据挖掘中应用和研究.pdf

上传人:1006108867 2016/1/14 文件大小:0 KB

下载得到文件列表

潜在语义分析在互联网数据挖掘中应用和研究.pdf

相关文档

文档介绍

文档介绍:湖南大学硕士学位论文潜在语义分析在互联网数据挖掘中的应用研究姓名:唐朝辉申请学位级别:硕士专业:计算机应用技术指导教师:李仁发;曾庆光20090511潜在语义分析在互联网数据挖掘中的应用研究摘要互联网搜索现已成为人们学****和生活中必不可少的一部分,互联网知识的合理组织、互联网知识的快速有效地获取、对互联网链接结构的挖掘以及信息系统的个性化推荐都会在很大程度上影响互联网用户的使用体验。同时,信息爆炸式的增长已经使大量互联网用户迷失在知识的海洋。因此,对互联网数据进行挖掘对于改善人们的学****和生活具有重大的现实意义。本文介绍了互联网数据挖掘的研究现状,重点论述了互联网链接结构挖掘和使用挖掘,同时在深入剖析了潜在语义分析技术的数学模型和实现原理的基础上,提出了两个算法:基于潜在语义分析的HITS改进算法以及基于潜在语义分析的个性化推荐算法。文章给出了改进HITS算法的具体描述,深入分析了算法的参数设置、实现、时间空间复杂度以及实验结果;对新提出的个性化推荐算法也从算法描述、算法系统框架、算法评价指标、算法实验等多方面作了深入的分析。接着利用对比实验验证了改进HITS算法在性能上的提高以及新提出的个性化推荐算法性能。本文最后给出了原型系统的设计。系统设计不仅考虑了系统功能的实现细节,同时也考虑了系统的可扩展性、可维护性以及对已有代码的重用。实验结果表明,改进的基于潜在语义分析的HITS算法与原算法相比,有更高的查全率和时间效率,且算法返还的搜索结果总体上更加权威、更有参考价值:基于潜在语义分析的个性化推荐算法通过提供合理的推荐策略,在低维用户语义空间和低维资源空间中挖掘用户与用户、资源与资源之间的相似度,实现的个性化推荐系统在实验样本不太大的情况下,表现出较理想的推荐性能。综上,本文提出的改进HITS算法与个性化推荐算法在潜在语义分析技术的支持下,不但提高了时间效率,而且由于加入了基于数学统计的“语义”支持,算法可以在低维的语义空间上进行信息处理,既提高了算法的空间效率,又提高了算法信息处理的准确度。关键词:互联网搜索;潜在语义分析;奇异值分解;?TS算法;个性化推荐硕’eanindispensablepartinpeople’,linkstructure,mendationoftheinformationsystemallaffect,toalargeextent,users’,dataminingisofgreatpracticalsignificanceinimprovingpeople’,(LSA),thepresentstudypresentedtwoalgorithms:theimprovedLSA-basedHITSalgorithmandtheLSA-,itsparametersettingandrealization,plexity,,thesystemarchitecture,theindexesofthealgorithmperformance,,,,butalsothescalabilityandmaintainabilityofthesystem,