1 / 6
文档名称:

信息检索技术论文.docx

格式:docx   大小:13KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息检索技术论文.docx

上传人:dlmus2 2022/6/19 文件大小:13 KB

下载得到文件列表

信息检索技术论文.docx

文档介绍

文档介绍:信息检索技术论文
信息检索技术论文
信息检索技术论文
[摘要]通过对近年来计算机科学、人工智能、专利文献加工等领 域的发展进行总结,从多语言混合检索、分类检索、语义检索、图 像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新 ,而不是对字符串进行简单的机械匹配,因此可避免关键 词匹配检索中由于词和义不对应所导致的问题。
语义检索过程一般包括对被检索的文档以及输入的检索式进行语 义分析和匹配处理。这种语义分析处理依赖于词汇的语义描述技术 以及分别用于词义鉴别和词汇过滤的语义识别技术和词汇链算法。 可以通过诸如WordNet等语义词典对词汇实现较完备的语义描述, 保证人和机器对词汇的理解一致。
最新发展的潜在语义索引通过将文献搜索过程中的向量空间模型 和奇异值分解相结合,可以揭示文档中的词间关系,因而适于构建 专利文献搜索引擎”…。利用语义进行检索还可以将专利文献中的 非技术性信息考虑在内,例如将特定的技术概念和申请人、发明人 等信息进行语义联系。此外,语义检索还可以从用户角度出发,考 虑用户的检索需求,从而为诸如查新、侵权等不同目的的检索提供 相应的结果。
近年来国内一些开发商也纷纷提供具有语义检索功能的专利文献 检索系统,例如东方灵盾开发的专利检索系统和
Patenticst网站。 Patentics网站除了可以实现传统的关键词检索功能,还支持语义 检索,仅通过输入检索所针对的专利文献号,即可自动对其进行语 义分析、文献检索,并对结果进行相关度排序。当前专利文献检索 领域还未广泛应用语义检索,但随着研究的深入,相信未来的搜索 引擎不仅能利用语义技术提高检索的效率,还有望能对检索结果进 行分析、评价,甚至自动生成检索报告。
5、图像检索
根据对图像检索所使用方法的特征可以分为基于文本的图像检索 法(TBIR)和基于内容的图像检索法(cBIR)。专利文献一般都带有大 量的附图,包括机械结构或化学结构式附图、电路图、方框图、流 程图或曲线图等。与传统的关键词检索和分类号检索相比,CBIR更 加直观、快速,而且可以克服因文字表述差异而导致的漏检,因此 它正在成为专利文献检索领域的研究热点。专利文献的附图都是黑 白二元图像(本文
所称专利是指发明和实用新型专利,不包括外观设计专利),不 存在颜色和纹理等特征,因此专利文献的图像检索主要是基于形状 和区域的图像特征。
虽然目前还没有成熟的专利文献图像检索系统,但一些研究机构 已经开发出若干可专门用于专利文献的图像检索原型系统,例如 IITKanpur 的 PATseek、 InformaticsandTelematicsInstitute 的 PatMediat 以及 LTUtechnologies 公司的 ImageSeeker 等。PATseek 专门针对美国专利文献进行图像检索,而PatMedia网站上的试验系 统仅针对欧洲专利局的专利文献,这两个图像检索系统都可实现直 接输入待检索的图像,系统自动进行相似度匹配,直接提供专利附 图,同时还可以进行基于文本的图像检索。
典型的专利图像检索系统包括专利文献处理部分和图像检索部分, 如图1所示:
文献处理部分又进一步包括文献预处理和视觉、文本元数据提取 和索引两部分。前者是找出文献中的图形和对应的文字描述;后者则 是进一步进行图