文档介绍:培养单位:扬州大学专业名称:管理科学与工程研究方向:知识管理研究生:宫海平鄣阃诰蛳低车墓丶际跹芯昵胙镏荽笱Чぱ妒垦宦畚指导教师:王愚扬州
鵸甀嚣騤甀簟縉/&顄‘五吲暑盖Ⅱ
摘要随着互联网的迅速发展和普及,互联网己成为人们获取信息的重要渠道;同时,它也成为人们表达自己观点、看法、情感的平台。因此,在各大电子商务网站、电子公告板以及门户网站上出现了大量的有关各种商品的评论信息。商家和厂家的决策者需要了解顾客使用他们商品情况的反馈意见,潜在的购买者也需要根据别人的使用体验来作出是否购买该商品的决定。对于商品生产厂家和潜在的商品购买者而言,面对网络上如此大量、复杂的评论信息,如何迅速有效地获取自己感兴趣的商品评论的总体观点极性倾向的还是负面的统晌A艘桓鲂碌奈侍狻9鄣阃诰蚣际醯某鱿郑俏A私决这个问题。它融合了信息检索、信息抽取、文本分类、机器学习、自然语言处理、本体论等众多技术,具有一定的文本理解能力,更具有一定的智能性。近年来观点挖掘技术的研究十分活跃,由于观点挖掘涉及到大量的理论技术,本文只对观点挖掘系统中的几个关键方面进行了深入的研究,并尝试构建了一个观点挖掘系统蚣埽饕5难芯抗ぷ魅缦拢根据算法的思想,结合基于文本内容的启发式方法和基于捶治龅姆椒ǘ咧涞挠诺悖岢鲆恢中碌呐佬蟹椒ǎN颐堑墓点搜索系统专门设计了分布式的、改进的聚焦网络爬虫算法,并实现了这个高效的分布式的聚焦爬虫子系统。基于最大熵和支持向量机的方法进行评论的高质量与低质量分类研究,过滤掉大量低质量的商品评论,从而保证观点搜索系统能够给出高质量的查询结果。利用《知网》构造具有主观性词的种子列表,然后,根据从《知网》中获得的主观词种子列表以及《知网》中词与词之间相似或相反的关系提出了一个观点词的极性倾向判别算法,从而构建一个带有标注词语情感极性倾向的主观词词典。使用了本论文的成果以及其它研究者的成果设计了一个基于观点评论挖掘系统框架。关键词:观点搜索;聚焦爬虫;文本过滤;情感倾向
猶琲,,.
:;
目选题背景⋯⋯⋯⋯⋯⋯⋯.本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.问题描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..理论基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...劢古莱嫦低称教ǖ拇罱ā选题意义⋯⋯⋯⋯⋯⋯⋯.国内外研究现状简介⋯⋯⋯⋯论文主要工作及组织结构⋯⋯..传统的基于主题的搜索引擎⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.评价标准和实验结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..髀邸喙馗拍詈突±⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.≡瘛
实验及相关分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..观点挖掘的定义及研究颗粒度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本文总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..未来展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..问题描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..相关研究工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.数据集及预处理⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯.基于最大熵和闹形牡椭柿可唐菲缆鄣募觳狻鞴坌云缆畚谋厩楦星阆蚍掷嗟难芯俊现有的观点挖掘系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.鄣闼阉飨低晨蚣堋芙嵊胝雇参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.致洹攻读硕士学位期间发表的学术论文目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.扬州大学学位论文原创性声明和版权使用授权书⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.特征选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.主观观点词典构造⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..鞴酃鄣阒肿拥幕袢≡臁主观观点词词典的构建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.典型鄣阃诰蛳低臣蚪椤低车纳杓啤本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.M芳蚪椤璲⋯⋯⋯⋯⋯⋯.