文档介绍:计算机研究与发展DOI:—!!里!!竺!兰竺竺旦竺!!!墨!!!!!!皇!!!里!!!!里竺!!!!!!!!!!!!二!!!:!!!!微博数据挖掘研究综述丁9I云1’2’3贾焰3周斌31(国防科学技术大学信息系统与管理学院长沙410073)2(国防科学技术大学信息系统工程重点实验室长沙410073)3(国防科学技术大学计算机学院长沙410073)(******@nudt.)SurveyofDataMiningforMicroblogsDingZhaoyunl'2~.JiaYan3。andZhouBin31(CollegeofInformationSystemsandManagement,NationalUniversityofDefenseTechnology,Changsha410073)2(ScienceandTechnologyonIn如rmationSystemsEngineeringLaboratory,NationalUniversityofDefenseTechnology,Changsha410073)3(puter,NationalUniversityofDefenseTechnology,Changsha410073),terminalexpansion,contentsimplicity,lowthresholdandSOon,ments,transforminformationandacquireknowledge,,,theresearchonmicroblogsisquitevaluablefromboththeoreticalandpracticalperspective,.,,works,microblogshavetheiruniquecharacteristics,includingnoisydatadiversity,socialmedia,multi—relations,therapidspreadandevolutionary,nonlinearity,,,;datamining;textmining;work;socialmedia摘要随着近几年微博的快速发展与普及,微博凭借平台的开放性、终端扩展性、内容简洁性和低门槛等特性,在网民中快速渗透,已发展成一个重要的社会化媒体,微博成为网民获取新闻时事、人际交往、自我表达、社会分享以及社会参与的重要媒介以及社会公共舆论的重要平台,,与一般信息网络不同,微博本身具有大规模、噪音数据多样性、快速传播演化性、非线性、社会媒体性以及多关系等特征,因此其在分析方法和挖掘目标上都与传统信息系统具有很大差别,:201301-21;修回日期:2013-0827基金项目:国家“九七三”重点基础研究发展计划基金项目(2013CB329601,2013CB329602);国家自然科学基金项目(61372191,71331008,61302144)万方数据计算机研究与发展201,(_{1),同时分析了Twitter数据集特征,且总结了未来研究面,临的挑战.