1 / 4
文档名称:

基于改进潜在语义分析算法的文本情感分类研究.pdf

格式:pdf   大小:158KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于改进潜在语义分析算法的文本情感分类研究.pdf

上传人:wxc6688 2022/1/5 文件大小:158 KB

下载得到文件列表

基于改进潜在语义分析算法的文本情感分类研究.pdf

相关文档

文档介绍

文档介绍:第 19 期 计算机教育
50 2014 年 10 月 10 日 Computer Education
文章编号:1672-5913(2014)19-0050-04 中图分类号:G642
基于改进潜在语义分析算法的文本情感分类研究
王旭仁,郑秋辉,刘丽珍,黄向阳,刘 杰
(首都师范大学 信息工程学院,北京 100048)
摘 要:针对文本挖掘过程中存在的搜索空间过大问题,介绍潜在语义分析的方法,指出该方法应用
在文本情感分类中,具有空间占用小的优点,阐述潜在语义分析算法通过对词项和文档矩阵进行奇异
值分解,能够有效降低文本情感分类的搜索空间并对词项在语义层面进行分析,解决一词多义的问题。
关键词:潜在语义分析;文本情感分类;向量空间模型
1 背 景 系。与传统向量空间模型不同的是,潜在语义分
析算法将词和文档映射到潜在语义空间,从而去
在文本分类领域中,常采用向量空间模型
除了原始向量空间中的一些“噪音”,提高了信
(Vector Space Model)对文本进行表示。用文本
息检索的精确度。在技术上,它同向量空间模型
中 M 个关键词构成文档向量,理论上任何可以
类似,都是采用空间向量表示文本,但通过矩
分词的语言,都可以用向量空间模型表示 [1],这
阵的奇异值分解(Singular Value Decomposition,
种模型将非结构化的文本表示成向量的形式,使
SVD)降秩的方法,减少了词-文档矩阵的维数,
文本的处理可以用计算机和各种数学方法完成。
消除了同义词、多义词的影响,提高了后续处
传统的向量空间模型将文本表示成以词为元
理的精度,同时达到了信息过滤和去除噪声的
素的向量形式,文本与文本之间的相似度通过计
目的。
算它们的向量夹角间的