文档介绍:1
)学位论文作者签名中:/商掺稻签字同期:学位论文作者签名中:筒酷璐学位论文独创性声明学位论文版权使用授权书一———————————————————————————————————————————一2jrr一—————————————————————————————————————————————一本学位论文作者完全了解直昌太堂有关保留、使用学位论文的规定,有权其他人已经发表或撰写过的研究成果,也不包含为获得直昌太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。同时授本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含贡献均己在论文中作了明确的说明并表示谢意。权中国科学技术信息研究所和中国学术期刊馀贪电子杂志社将本学位论文收录到《中国学位论文全文数据库》和《中国优秀博硕士学位论文全文数据库》中全文发表,并通过网络向社会公众提供信息服务。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ导师签名中:签字日期:/阹月同签字同期:#
2
3
摘要验,并且对法律条款不熟悉,这样导致了一些治安违法案件处罚不当的情况时有发生。为了解决这一问题,本文设计了一种基于领域本体的案情文本挖掘模是探讨了案情文本挖掘中的关键技术。本文先简单地介绍了领域本体的构建原对它缺乏领域知识的支持,而忽略了文本语义的缺点,本文引入法律本体为案近年来,随着各地基层公安队伍不断扩充,部分公安执法人员缺乏执法经型,利用法律本体为案情文本挖掘提供领域知识,并且基于案情文本的特点改进了传统的文本挖掘方法,实现了对非结构化的案情文本的分析处理,使之能够自动匹配相关法律条文,为公安办案人员在执法过程中提供法律支持。本文的研究内容主要分为两个方面:一是研究了法律本体的构建过程;二则、方法及工具,然后,根据案情文本挖掘的需求,借鉴了大学本体构建“七步法”,构建了一个基于本应用的法律本体模型。另外,本文中案情文本挖掘的关键技术包括案情文本的形式化表示和案情文本分类这两部分。本文首先在文本预处理过程中添加了自定义关键词库改进了案情文本的分词效果,接着介绍了基于特征词的向量空间文本表示模型,针情文本表示提供背景知识,采用了领域本体中的概念代替特征词,降低了文本向量的维数,改进了案情文本表示效果。此外,本文利用法律本体结构树,计算出概念间的相似度矩阵,调整概念权重,从而改进了文本相似度计算方法,提高了案情文本分类的准确性。关键词:案情文本挖掘;法律本体;文本分类;中文分词;文本相似度计算
4
5
nstruct..—traditionalmethodsfinallyprovideestudyminingandandyearswiththecontinuedexpansionlocal畆,lawenforcement-andthe3,-InordersolVeDroblemthispaperdesignsbasedframeworkfor,knowledgecharacteristicsprocesstextandautomaticallymatchtermsSosupporttheirenforcementprocessThedividedtwoaspectson.;-fect—librarypreprocessingThenintroducerepresentation-wesemanticsimDroveusingontol0937:insteaddimensioninformationⅲ瑃Abstractarent·contenttext,
6
WordsLe_oal:)?TextCategorizationChinese;can
7
≡瘛文本分类方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯K1