文档介绍:北京化工大学硕士研究生学位论文目适用于手机取证的中文短文本分类方法研究与实现题五月二十九日期:二。一二年日
保密论文注释:本学位论文属于保密范围,在土年解密后适用本授北京化工大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:日期:关于论文使用授权的说明学位论文作者完全了解北京化工大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京化工大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。导师签名:
答辩委员糊学位论文数据集中文短文本分类,权重计算,特征扩展,支持向量机,朴素贝叶斯中图分类号学科分类号论文编号密级公开学位授予单位代码学位授予单位名称北京化工大学作者姓名初冲学号获学位专业名称计算机应用技术获学位专业代码课题来源自选项目研究方向信息安全论文题目适用于手机取证的中文短文本分类方法研究与实现关键词论文答辩日期畚睦嘈应用研究学位论文评阅及答辩委员会情况姓名职称工作单位学科专长指导教师易军凯教授信息安全、电子取证评阅人孙建伟北京理工大学李辉副教授信息安全技术王学伟信息工程答辩委员张凤元信号处理袁洪芳信号与信号处理胡伟照片与视频计算压::》查询。学科分类号在中华人民共和国国家标准疶—《学科分类与代码》中查论文编号由单位代码和年份及学号的后四位组成。。——.
适用于手机取证的中文短文本分类方法研究与实现实验结果表明,改进的基于矽米矿术矽的短文本分类方法在基于特征摘要中文短文本分类近年来随着国内移动互联网的快速发展和智能手机的普及成为一个新的研究热点。在电子取证领域,如何快速准确的从手机等设备的大量短信文本中提取出有用信息成为取证人员面临的一个问题,而短文本分类是一个有效的解决该问题的方法。在其它如社交网络、知识问答系统和信息检索等领域,中文短文本分类也有着广泛的应用前景。本文立足于解决手机取证中的中文短文本分类问题,对目前应用于短文本分类的多种方法进行了比较学习与研究。首先,讨论了应用于文本分类的主要技术,指出目前应用于短文本分类的方法主要包括两类,一类是现有的应用于长文本分类的方法以及在此基础上的改进方法,主要包括基于特征权重的多种方法,另外一类是借助外在的知识库增加短文本的信息量的方法,主要包括基于特征扩展的方法;然后,本文重点介绍了六种基于特征权重的分类方法,以维基百科为知识库的基于特征扩展的分类方法,和适用于短文本的特点的三种基于特征权重的改进方法。最后,本文设计实验对这些方法的分类效果进行了比较,并详细介绍了这些方法的各个模块的具体实现,并对实验数据进行了分析。权重的九种分类方法中分类效果最好,同时该方法与基于特征扩展的方法相比整体的分类效果相差不大,但是该方法稳定性更好;在分类算法的比较中,谥形亩涛谋局械姆掷嘈ЧI院糜贜椒ā
关键词:中斯
甀痮琱仔瑆琲瓵甀,..,行:摘要
獁,够木驴木可鷗篊┌搿问跣某琒琒,印錯—,甧羠,,,.瑃,’琲.,琭北京化工大学硕士学位论文.;