文档介绍:“悟置嘎覆僵僖重庆邮电大学硕士学位论文左塑丝趁丝圣送盔盏;王细薇论文提交日期窒旦生垒月论文答辩日期硕士研究生论文评阅人答辩委员会主席年月分类号——日
导师签名:蕴矿学位论文作者签名:王;嗣板学位论文作者签名:王今旧救签字日期:加。,也不包含为获得重庞自碧没蚱渌逃!年拢唬重麽邮电态堂重麽自闾本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签字日期:本学位论文作者完全了解有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ文。
摘要即时通讯技术的发展以及信息技术的普及促进了手机短信、基于互联网和手机短信息的客户评论等短文本信息处理技术的发展,同时短文本处理技术的发展和实际应用又息息相关,它在信息安全、客户评论反馈等领域都存在着实际的需求,使中文短文本分类问题成为一个重要的研究方向。由于短文本所描述概念信号弱的特性,现有的对长文本分类性能好的分类技术用于短文本时分类器性能变坏。短文本分类的可行途径是利用外部资源中的额外信息来辅助分类,以弥补短文本的固有缺陷。关联规则挖掘算法正好可以在一定程度上解决短文本知识发现的问题。本文利用关联规则挖掘算法,就中文短文本中共现关系的挖掘、特征的扩展进行了研究。主要工作如下:岢鲆恢只诓馐晕谋咎卣骼┱沟亩涛谋痉掷喾椒ā8梅椒ńǘ文本视作事务,将特征词视作项,,创建特征共现集作为扩展词表。在分类阶段,先根据特征共现集把测试文本中的特征的共现词作为特征补充进来,然后再进行分类。岢鲆恢只谘盗肺谋咎卣骼┱沟亩涛谋痉掷喾椒ā8梅椒ㄓ中方法基于相同的扩展词表,但是扩展方法不同。在没有引入新的特征的前提下,在训练阶段用一种基于共现关系的特征权重调整方法实现训练文本特征扩展。实验结果表明,这两种方法具有较高的分类性能,其微平均和宏平均值都高于常规的文本分类方法,在一定程度上解决短文本所描述概念信号弱的问题。关键词:短文本分类,关联规则挖掘,特征扩展,共现关系重庆邮电大学硕士论文
劬慨鷒鷈响、№,,锄譴船,脏萤胁锄鷇簔齞【鳟耹嬲皁,⒑魋,皿:彤瞖屡簟痗鄀鷇曲鄑辌琧鮪狥籉琣Ⅱ.畉,甀瞖,琺圮,.騦部Ⅱ..—,瑆】....·
重庆邮电大学硕士论文,—
目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”第一章绪论·引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯短文本分类的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文工作内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章相关理论基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯文本分类相关理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.≡⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。第三章基于测试文本特征扩展的短文本分类研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯特征共现集的创建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。测试文本特征扩展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯~.馐远涛谋咎卣骼┱顾惴ā实验测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.形亩涛谋痉掷嗍笛榻峁敕治觥重庆邮电大学硕士论文⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第四章基于训练文本特征扩展的短文本分类研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯训练文本特征扩展的策略⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.诠蚕止叵档奶卣魅ㄖ靥嵘扑