1 / 6
文档名称:

基于聚类的网络舆情热点发现及分析.pdf.pdf

格式:pdf   页数:6页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于聚类的网络舆情热点发现及分析.pdf.pdf

上传人:zbggqyk171 2016/4/28 文件大小:0 KB

下载得到文件列表

基于聚类的网络舆情热点发现及分析.pdf.pdf

文档介绍

文档介绍:74 ????现代图书情报技术基于聚类的网络舆情热点发现及分析* 王?伟?许?鑫(华东师范大学信息学系?上海200241) ?摘要根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量, 使网络舆情分析更为准确可靠。?关键词网络舆情?热点发现?舆情分析?文本聚类?分类号 OnlinePublicOpinionHotspotDetectionandAnalysisBasedon DocumentClustering WangWei?XuXin (DepartmentofInformatics,EastChinaNormalUniversity,Shanghai200241,China) ?ordingtotherequirementofonlinepublicopinionanalysis,thispaperbuildsanonlinepublicopinion featuresfromsampleWebpages,andgetthehot--spot cluster,,itgetsthetmieevolutionmodeaboutthepublicopinion toafforddecisionsupportforspecificfield,andmiprovesthequalityofpagecorrelationandanalyzethepublicopinion urately. ?KeywordsOnlinepublicopinion?Hotspotdetection?Publicopinionanalysis?Documentclustering ??收稿日期:2009-01-12 ??收修改稿日期:2009-02-02 ??*本文系教育部人文社会科学研究项目!互联网舆情信息分析与管理机制研究?(项目编号:08JC870003)的研究成果之一。 1?引?言??随着互联网的日益普及,NIC)2008年6月发布#第22次中国互联网络发展状况统计报告?数据显示:截至2008年6月底,,网民规模跃居世界第一[1]。网络越来越成为人们获取与发布信息的主要渠道,网络舆情信息的导向作用愈来愈大。网络信息庞杂多样,虽然对社会的发展起了积极作用,但同时也产生了随之而来的信息内容安全问题,反动、***秽、迷信等有害信息在网络中的传播,严重危害了国家的安全和社会的稳定。另一方面,十六届四中全会做出的#中共中央关于加强党的执政能力建设的决定?中提出,!建立舆情汇集和分析机制,畅通社情民意反映渠道?,