1 / 78
文档名称:

基于数据挖掘技术的专利信息分析及应用研究.pdf

格式:pdf   页数:78
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据挖掘技术的专利信息分析及应用研究.pdf

上传人:山吉 2014/2/19 文件大小:0 KB

下载得到文件列表

基于数据挖掘技术的专利信息分析及应用研究.pdf

文档介绍

文档介绍:首都经济贸易大学
硕士学位论文
基于数据挖掘技术的专利信息分析及应用研究
姓名:罗璇
申请学位级别:硕士
专业:管理科学与工程
指导教师:张军
2011-03-10
首都经济贸易大学硕士学位论文《基于数据挖掘技术的专利信息分析与应用研究》
摘要
专利信息是最新的科技发展水平的集合,具有内容新颖、覆盖面广、实用可靠、
信息量大等显著特点,在国家政府机构的决策、技术创新、资源的配置、科技项目的
规划、行业的发展方向、企业的经营决策等各方面都拥有巨大的价值及潜在价值。传
统的统计分析方法已经不能满足人们开发利用专利信息资源的需求,集成了多种学科
技术的数据挖掘成为了专利信息分析法的必然发展趋势。
数据挖掘技术是解决数据丰富而知识贫乏的有效途径,是信息科学研究领域的重
要研究课题之一,相关的研究和应用能够提高决策支持的能力,在数据库研究中是一
个富有应用前景的领域。数据挖掘已经广泛应用于诸多领域以解决许多商业问题,并
且取得了良好的社会效应。
由于专利信息的特殊性——同时具有外部特征项和内部特征项,既有需要进行定
量分析的外部指标,又有需要定性分析的文本内容,所以作为数据挖掘技术重要技术
手段的关联分析和文本聚类有着非常广泛的应用前景。关联规则挖掘是从大量的、不
准确的、嘈杂的现实数据中挖掘出隐含在其中的、潜在的有价值的相关信息和知识的
过程。文从 Agrawal 等人第一次提出了基于商业数据库的项集之间的关联关系研究
问题以来,很多研究人员对挖掘数据中潜在的关联规则问题进行了大量的更加深入的
研究。本聚类首先需要对文本进行预处理,通过分词、特征选择或特征抽取等过程将
文本转化成计算机可处理的格式化数据如文本向量,然后使用聚类算法进行聚类。层
次聚类方法对给定的数据集进行层次似的分解,直到某种条件满足为止。相较于另一
种较为常见的聚类算法——以 k-means 和 k-medoids 为代表的划分方法而言,层次聚
类法不需要预先指定聚类的个数,更有利于在不清楚数据属性的情况下进行文本聚
类。
在数据挖掘技术的应用方面,本文面向专利信息挖掘应用的实际需求,分析了专
利文献的应用及其用途,研究了专利技术、专利文献的自身特点,以及专利文献蕴涵
的丰富的技术信息、法律信息和商业信息,寻找将数据挖掘技术应用到专利文献中的
途径。并以混合动力电动汽车领域在中国境内专利申请情况为主要背景,在行业研究
的基础上,利用数据挖掘技术中的关联规则挖掘和文本聚类分析相结合的方法对丰田
自动车株式会社在华申请的所有专利进行了深入分析,将数据挖掘的方法和知识理论
应用到实际系统中,实现了专利文本信息与技术主题指标相结合,并为今后的专利信
息挖掘工作提出了几点建议。

关键词:数据挖掘聚类分析关联分析混合动力电动汽车
I
首都经济贸易大学硕士学位论文《基于数据挖掘技术的专利信息分析与应用研究》

Abstract
Due to the publication of patent documents, the public will stand to gain from the
technical knowledge of inventions because of the published information in these
documents. Therefore, patent information is a very useful resource of technical knowledge
for researchers, engineers and scientists who are involved in the work panies,
research institutes and governments. Moreover, data mining id believed to be the trend of
the techniques used to exploit patent information. As the most form of patent information
id text, text clustering which is one of the most important data mining operations has very
high applied values.
Data mining technology is an effective approach to resolve the problem of abundant

最近更新

风电场发电量预测模型 37页

2025年全南县幼儿园教师招教考试备考题库附答.. 30页

非热压膜分离技术 34页

2025年内蒙古体育职业学院单招职业适应性测试.. 42页

2025年内蒙古锡林郭勒盟单招职业倾向性考试题.. 44页

2025年南丹县幼儿园教师招教考试备考题库附答.. 31页

2025年南京邮电大学马克思主义基本原理概论期.. 13页

2025年南昌县招教考试备考题库带答案解析 31页

2025年南阳科技职业学院单招职业倾向性考试题.. 43页

肩关节强直病理生理学探讨 36页

绿色舞台材料应用 39页

2025年咸丰县幼儿园教师招教考试备考题库及答.. 30页

2025年哈尔滨职业技术大学马克思主义基本原理.. 12页

2025年四川应用技术职业学院马克思主义基本原.. 12页

绿色酒店认证标准与市场影响 35页

肺间质纤维化纳米技术应用研究 23页

高血压脑病认知功能障碍的发病机制 35页

高温高压化学反应的优化研究 35页

2025年宁夏财经职业技术学院单招综合素质考试.. 44页

2025年安徽林业职业技术学院马克思主义基本原.. 12页

2026年龙猫观后感400字 6页

耐药性表型与临床表现关联 35页

2025年宣化科技职业学院马克思主义基本原理概.. 13页

2025年密云县招教考试备考题库附答案解析(夺.. 30页

2025年山东医学高等专科学校马克思主义基本原.. 13页

2025年山西电力职业技术学院马克思主义基本原.. 12页

2025年巨野县招教考试备考题库带答案解析(夺.. 31页

2025年广东省外语艺术职业学院马克思主义基本.. 13页

2025年广灵县招教考试备考题库附答案解析(必.. 32页

2025年庆阳职业技术学院马克思主义基本原理概.. 12页