文档介绍:疭,,甊.
中南林业科技大学作者签名:阍撇导师签名:浏钐孑作者签名:心∥姚学位论文原创性声明例年氯匀学位论文版权使用授权书洳陏冗绥不保密日。氯匀矿¨年本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品,也不包含为获得中南林业科技大学或其他教育机构的学位或证书所使用过的材料。对本文的研究作出荤要贡献的个人和集体,均已在文中以明确方式表明。本人完全意识到本声明的法律后果由本人承担。本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件或电子版,允许论文被查阅或借阅。本人授权中南林科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采片坝⑺跤』蛏璧雀粗剖侄伪4婧突编本学位论文。本学位论文属于:保密口,在年解密后适用本授权书。肽谝陨舷嘤Ψ娇虼颉啊獭
!!!!!!
摘要内容是怎样通过新事件检测系统检测出事件的第一·篇新闻报道。困内相关研究虽级硕士学位论文随着因特网的普及,新闻网页已经成为人们获取信息的一个主要来源之一。但面对浩瀚的信息量,人们需要借助某种方式来快速、准确地搜集自己感兴趣的信息。话题检测与追踪,是⋯项为了应对信息海罱的问题嬲箍5难芯俊C拦鷏昕J甲橹泄匮芯炕菇蠺测评,新事件检测琋魑F浠鸺巳挝裰唬芯康闹饕起步较晚,但由于话题检测与追踪在信息检索、文本分类等相关领域的实际应用价值,其相关研究已成为信息处理领域的热点。基本的新事件检测系统主要分为文本表示、文本的比较与文本分类与时间窗口选择等几大模块。本文在国内外研究的基础上,以文本形式的中文新闻数据流为处理对象,对自然语言处理技术中时间信息的统一表达、地名的规范化处理、人名库的有效建立方等方面作了改进。特别地,考虑到新闻报道趋向于尽早将报道要义告知读者的特点,本文提出了位置信息这一概念,并在此基础之上通过可加函数和可乘函数对嗨票冉虾懈慕N谋镜姆掷喾矫妫疚闹胁用的支持向量机琒姆椒ㄓ新允档氖Щ。机器学习领域关注度相当高的一种方法,尤其是在无监督情形下有着良好的鲁棒性,已被成功的应用于模式识别及回归问题的分析。本文对从中新网、新华网等大型网站收集的含有个主题的篇新闻文档分别采用核回归法⒆,通过对采用基本低澈透慕蟮腘系统进行实验得出的检测代价系数进行对比,得到三种方法对应的代价系数分别降低了%、%和%。由此说明了低吃谟τ昧嘶谛挛庞锪咸卣鞲慕南蛄靠占淠P和采用体现了词汇位置信息的嗨票冉虾螅捎肧方法进行文本分类较之以核回归方法和最近邻域方法进行分类,低车男阅芴嵘佑效。关键词:新事件检测;支持向量机:向量空间模型.
级硕士学位论文琈甋瓾,..,.:琩甀,.,瑃甇,.瑆甇,.,甆瓾,..¨
鷅。。,!。甌籚:籗
’。。。。’’——