1 / 77
文档名称:

基于混杂模型的上下文相关主机入侵检测系统.doc

格式:doc   页数:77
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于混杂模型的上下文相关主机入侵检测系统.doc

上传人:策划大师 2011/11/13 文件大小:0 KB

下载得到文件列表

基于混杂模型的上下文相关主机入侵检测系统.doc

文档介绍

文档介绍:硕士研究生学位论文
题目:基于概率模型的名人网页相关度评价
姓名:
学号:
院系: 信息科学技术学院
专业: 计算机系统结构
研究方向: 网络与分布式系统
导师: 教授
二零零五年五月
版权声明
任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人,亦不得随意复制、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权之问题,将可能承担法律责任。
摘要
本文的工作是在北京大学网络实验室、北京大学计算语言所与北京大学— IBM创新研究院联合研发的天网知名度系统(Fame)中开展的。针对原有系统名人网页相关度评价中存在的问题,本文中提出了一种基于概率模型的名人网页相关度评价模型。
首先,针对Fame系统中名人网页相关度评价的特点,构建基本相关度评价模型。构建基础是Okapi BM25检索模型,在其基础上引入HTML标记权重系数,改进Okapi BM25公式,弥补其没有考虑HTML标记的不足。利用Fame系统数据集进行评测,实验结果表明HTML标记系数的引入提高了系统相关度评价质量,同时显示该基本模型优于原有系统中的相关度评价模型,提高了系统性能。
其次,由于不同领域名人的属性信息对其相关度评价有不同的贡献,本文中构建了区分领域的多层次实体模型,来更好地描述用户的信息需求。同时在基本模型基础上引入属性信息权重系数,使基本模型从不支持结构化查询需求改进为支持多层次实体模型。各领域的权重系数通过训练集训练的方式获得,避免了人工赋予方法的不确定因素。选取对系统相关度性能提高最大的一组权重系数作为模型中的领域参数,该套参数通过测试集的测试,证明有较好的适用性。
再次,采用了伪反馈和用户反馈两种相关反馈方法,为实体属性信息进行权重的自动调整,以达到系统相关度评价的进一步优化。通过实验得出的结论是:1)初始检索的质量很大程度地影响伪反馈的效果。应该先对初始检索模型进行优化,再使用伪反馈,这个顺序很重要;同时初始检索的质量需要达到一定高度后,使用伪反馈才能提高系统检索质量,目前系统的初始检索质量仍不适宜直接进行伪反馈。2)用户反馈在总体上自动优化了属性信息权重,提高了系统相关度评价质量。3)用户反馈的效果受名人实体属性信息词数的影响,属性信息越丰富,采用用户反馈后评价质量提高的概率越大。
关键词:信息检索,相关度评价,概率模型,相关反馈
Probabilistic Model-Based Relevance Evaluation of Famous People’s Web Pages
Abstract
Tianwang Fame is an individualized information retrieval system. According to the main problems of the original relevance evaluation models, a probabilistic model-based relevance evaluation model is proposed in this dissertation to improve the relevance ranking of famous people’s web pages.
First, a basic evaluation model is built on the basis of Okapi BM25. The author introduced an HTML weight to Okapi BM25. The test on Fame data collection shows that this basic model brings improvements to the system.
Second, a multi-level area-differed entity model is built to fully describe the entities. The author brings an area-differed attribute weight to the basic model. The selection of the weights’ values is based on the training process on Fame’s training set. The variables are tested be effective to improve famous people’s relevance evaluation.
Last but not least, both pseudo-feedback an

最近更新

2025年洛阳文化旅游职业学院马克思主义基本原.. 13页

2025年海南卫生健康职业学院马克思主义基本原.. 12页

2025年湖南交通职业技术学院单招职业适应性测.. 43页

2026年中医住培带教师资理论考核题库100道附参.. 39页

2026年主管中药师考试备考题100道附完整答案【.. 37页

2025年皖南医学院马克思主义基本原理概论期末.. 12页

2025年竹溪县幼儿园教师招教考试备考题库及答.. 31页

2026年网络安全知识竞赛题库(典型题) 39页

小学历史与文化知识竞赛题库100道(巩固) 37页

新安全生产法知识竞赛试题库(考点梳理) 44页

最新全国政法队伍教育整顿知识竞赛试题库(满.. 40页

2025年龙里县幼儿园教师招教考试备考题库带答.. 31页

2026年医学微生物学习题集及答案【历年真题】.. 40页

2026年医学微生物学习题集及参考答案【满分必.. 41页

2026年时事政治测试题库附参考答案【完整版】.. 13页

小学历史与文化知识竞赛题库100道及参考答案(.. 37页

小学历史与文化知识竞赛题库100道【网校专用】.. 37页

新安全生产法知识竞赛试题库【巩固】 44页

最新全国政法队伍教育整顿知识竞赛试题库及参.. 40页

锌指蛋白家族转录因子ZKSCAN3的生物功能及其作.. 7页

2025年医学诊断服务合作协议书 64页

2025年加氢系列产品项目合作计划书 71页

跨学科学习视域下初中古诗词教学现状及优化策.. 31页

2025年重庆市绵阳市单招职业倾向性考试模拟测.. 44页

2026山西省面向东北大学选调优秀高校毕业生参.. 45页

2026年c语言理论考试题(实用) 13页

2026年南充文化旅游职业学院单招综合素质考试.. 44页

2026年四川中医药高等专科学校单招职业倾向性.. 43页

2026年大学商贸学院专升本C语言考试真题(考试.. 13页

2026年数组c语言考试题库(网校专用) 13页