文档介绍:基王垒△稹镭车耐湍嘲嗑题英文并列Ⅸ目目£研究方向:信息筐堡皇信息丕缠熬攫—职称:专叭跣┨谩躩匕塞直麴田区壬丕国嫂授予单位名称和地址
甁,
躲凼轧吼删。关于论文使用授权的说明的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。签名
摘要为了研究和建立北京市知识产权指标体系、知识产权公共信息服务平台与预警机制,从而提高北京市知识产权预警能力和高新技术产业竞争力,迫切需要大量准确的专利信息作为分析和研究专利与知识产权的基础。目前国内大部分政府和企业在专利资源的获取方面采用人工下载,或是通过搜索引擎搜索并下载,效率差、准确性低,获得的专利信息结构化差,不利于分析。本文研究了从美国专利商标局ɡ菘庵胁杉畔⒌娜ü蹋包括专利检索、接分析、专利下载、信息抽取等。并将深网术、多低臣际酢⒒赬的信息抽取技术等应用于专利信息的采集过程。目的在于从菘庵凶既贰⒖焖佟⒆远鼗袢〗峁够淖ɡ畔ⅰ本文使用基于多低车募际鹾头椒ㄉ杓屏俗ɡ畔⒉杉低场2杉统分为用户接口子系统、中心控制子系统、专利网页获取子系统、专利基本信息抽取子系统和专利被引信息抽取子系统,各子系统的核心分别为用户接口中心控制⑴佬械鞫華、基本信息抽取调度⒈灰畔⒊槿〉鞫1疚穆凼隽俗槌筛髯酉低车闹預结构及通信、调度方式和调度算法。本文使用语言,在环境中实现了专利采集系统原型并进行了采集实验,结果表明,原型系统能够快速、准确的采集专利信息,具有良好的性能和效本文的创新之处在于:第一,综合运用多种技术方法,如多低臣际酰基于男畔⒊槿〖际鹾拖喙乜T垂ぞ撸诿拦ɡ瘫昃质菘庵胁杉息。第二、研究并设计了专利采集系统的核心算法,包括中心鞫人惴ā爬行鞫人惴ā⒒拘畔⒊槿调度算法、专利被引信息抽取调度算法、专利信息页面获取流程、专利信息抽取流程、页面过滤与清洗算法、专利信息抽取规则等。第三、实现了专利采集系统原型,可以根据检索表达式自动下载、抽取专利,并将结构化的专利信息存储在本地数据库中。系统具有较高的效率。关键词专利采集;网页信息抽取;多低‘率。摘要
瑆琧甌甌琲,—,甌...
目录7⑵教ā!!要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第滦髀邸研究背景与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..赜贒隓畔⑺阉鞯难芯俊..郃系统应用于信息获取领域的研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...郃系统调度问题研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.....⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...褂肑7⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....印畔⒊⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..相关工具包⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....第伦ɡ杉低承畔⒃础ɡ畔⒆试础菘饧蚪椤ɡ掷唷ɡ焖髂J健ɡ侄谓馐汀本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...第禄贛的专利采集系统分析与设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....专利采集系统分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...摘与⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.
.!用户接口子系统设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...没Ы涌贏⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...中心控制子系统设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....行目刂艫⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....行目刂艫消息收发⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...行目刂艫调度算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..专利网页获取子系统设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....郴