文档介绍:1
课件制作:张胜光
第二章
检索原理和
搜索引擎
2
本章内容
搜索引擎原理和概况
2
门户网站和看不见的网站
6
网络信息检索原理
3
1
网页搜索引擎简介
3
3
网页搜索引擎使用方法
3
4
P2P搜索引擎使用方法
3
5
3
第一节 信息检索原理:关键词匹配原则
4
1、从“图灵实验”说起
大家都知道,计算机发展史上有一个重要人物图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。他并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。
5
2、计算机检索的奥妙:关键词匹配
计算机既然如此“无能”,连三岁小孩的智能都不具有,那么为什么人们要在网上查找信息,却总要通过计算机帮忙呢?计算机检索的奥妙在哪里呢?
原来,计算机实现检索的奥妙,就在于它能把你输入的检索词,与它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。
6
广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。
狭义的信息检索:
一个匹配( Match)过程
即用户使用检索语言对自己的信息需求予以描述,并在一定的信息资源系统中进行描述匹配的过程。
3、什么是信息检索?
7
存 储
检 索
原始文献
加工整理
数据库
提 问
检 索
输 出
“爱因斯坦论文”
“论文”
“爱因斯坦”
“论文”
“爱因斯坦”
8
4、信息检索原理
检索
提问式
信息
的选
择与
收集
信息
特征
标
识
语
言
检索工具
匹配
检
索
结
果
信
息
源
用
户
信
息
需
求
检索
提问
数据库
9
What?
Where?
How?
5、信息检索的要领
10