1 / 4
文档名称:

搜索引擎系统及该搜索引擎系统的结构化数据引入方法.docx

格式:docx   大小:19KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎系统及该搜索引擎系统的结构化数据引入方法.docx

上传人:421989820 2022/6/25 文件大小:19 KB

下载得到文件列表

搜索引擎系统及该搜索引擎系统的结构化数据引入方法.docx

相关文档

文档介绍

文档介绍:搜索引擎系统及该搜索引擎系统的结构化数据引入方法
专利名称:搜索引擎系统及该搜索引擎系统的结构化数据引入方法
技术领域:
本发明涉及搜索引擎技术,尤其涉及一种可搜索结构化数据的搜索引擎系统以及 该搜索引擎系统的结构化数据引入方法。
据的相关度权值根据数据文本的基础知识的相 关性来确定。
作为本发明的进一步改进,所述数据的相关度权值根据数据的特定特征的重要性 来确定。作为本发明的进一步改进,所述结构化数据包括与若干属性标签对应的属性值; 所述结构化数据存储库内还存储有语义模板,所述语义模板包括
有属性标签。作为本发明的进一步改进,该系统还包括需求分析模块,用于接收来自于客户端的查询词表达式,根据所述查询词表达式 确定相应的语义模板,并根据所述语义模板分析该查询词表达式,以确定所要搜索的结构 化数据;搜索组件,用于搜索结构化数据存储库以获取所要搜索的结构化数据。作为本发明的进一步改进,所述需求分析模块对查询词表达式的分析包括分析 出和语义模板中的属性标签对应的属性值,从而确定包含有所述属性值的数据为所要搜索 的数据。作为本发明的进一步改进,所述需求分析模块对查询词表达式的分析还包括根据 语义模板分析出所要搜索的属性标签;所述搜索组件还用于从所述获取的数据中抽取与所 述所要搜索的属性标签对应的属性值,并将所述属性值返回给客户端。作为本发明的进一步改进,所述需求分析模块对查询词表达式的分析包括根据 语义模板确定和语义模板中的属性标签对应的词项,并给所述词项标注相应的属性标签。作为本发明的进一步改进,所述需求分析模块还用于对查询词表达式进行优化。作为本发明的进一步改进,所述需求分析模块对查询词表达式的优化包括区间筛 选操作、和/或语义扩展操作、和/或分词操作。作为本发明的进一步改进,所述搜索组件还用于根据数据的相关度权值来对搜索 获取的数据进行排序。作为本发明的进一步改进,所述搜索组件还用于对排序后的数据进行打散操作。作为本发明的进一步改进,该系统还包括网页存储库,用于存储通过访问互联网 链接结构而抓取的网页文档;所述搜索组件还用于搜索网页存储库以获取与所述查询词表 达式相关的网页文档。作为本发明的进一步改进,该系统还包括合成模块,用于将获取的网页文档和结 构化数据合成后返回给客户端。作为本发明的进一步改进,该系统还包括用户界面,用于记录用户查询日志,所述 语义模板根据用户查询日志而获得。与现有技术相比,本发明的有益效果是本发明的搜索引擎系统通过预定的数据 交互协议获取结构化数据,方便了结构化数据的抓取和更新,并提高了搜索引器系统的资 源覆盖面。此外,用户在使用通用搜索引擎时,系统能够识别潜在的结构化数据搜索的需 求,并对结构化数据和普通网页文档进行综合搜索,从而为用户提供全面、准确的搜索结果。
图1是本发明的搜索引擎系统搜索结构化数据的一具体实施方式
的工作原理框 图2是本发明的搜索引擎系统搜索通用网页的一具体实施方式
的工作原理框图;图3是本发明的搜索引擎系统搜索结构化数据和通用网页的一具体实施方式
的 工作原理框图;图4是本发明的搜索引擎系统的结构化数据存储库中摘要式数据的一具体实施 方式;图5是本发明的搜索引擎系统展现搜索结果的一具体实施方式
;图6是图1所示的搜索引擎系统的结构化数据引入的工作流程图;图7是图3所示的搜索引擎系统