1 / 13
文档名称:

信息检索知识点.docx

格式:docx   大小:26KB   页数:13页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息检索知识点.docx

上传人:东风倩倩 2022/10/21 文件大小:26 KB

下载得到文件列表

信息检索知识点.docx

文档介绍

文档介绍:该【信息检索知识点 】是由【东风倩倩】上传分享,文档一共【13】页,该文档可以免费在线阅读,需要了解更多关于【信息检索知识点 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。计算机检索
(信息素质、信息能力):作为拥有IL(informationliteracy)能力的人,必定能够充分地认识到何时需要信息,并有能力去有效地发现、检索、讨论和利用所需要的信息,从而拥有平生学****的能力,总能够为任何任务和决策找到所需信息。

广义:指将信息依照必然的方式组织和储藏起来,并依照信息用户的需要找出相关信息的过程和技术。包括储藏和检索两个过程。
狭义:从信息会集中找出所需信息的过程。
信息查找(InformationSearch,InformationSeeking)

1)信息爆炸
以致文件量急剧增加,内容相互浸透,语种增加;
文件分布异常分别;
文件寿命愈来愈段;
2)由于条件限制,人们吸取和利用信息的能力并未获取相应的提
高。

1)促进智力资源的开发;
2)协助管理者做出正确的决策;
3)帮助科研人员借鉴先人的研究成就,防备重复劳动;
4)信息检索是知识更新的手段。
(1):作为图书馆数字资源的数据库特指为科学、授课、
学****所需各种参照资料的会集,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、初版商和其他机构以商业化方式供给的各种电子资源,图书馆需要支付必然的花销购买数据库的使用权再供给给必然的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
(2)
从收录文件的内容分,有综合性数据库和专业性数据库之分;从收录文件的种类分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文件数据库、专利文件数据库、标准数据
库等;
从供给文件的形式分,有全文数据库、文摘数据库、引文数据
库;
各数据库举例:
专业数据库:PetroleumAbstract(PA)、EnCSciFinderSchoiar(CA)
综合性数据库:读秀、Scopus、EI、SCI
特定文件种类,如图书、期刊、学位论文等:超星、EIsevierScienceDirect、PQDT
全文数据库:CNKI、维普、SPE
大纲性数据库:EI、PA
引文数据库:WebofScience、CSSCI(中文社会科学引文索引)
(SCI-E)是个什么样的数据库?
它是ISI检索平台中WebofScience核心合集中的一个子库
它是一个大纲型数据库
它是一个引文数据库
它是一个期刊数据库
它收录的学科范围包括科学、技术的各学科
?
学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;
文件种类:依照研究的需要。若是仅需要某种文件,最好选择该种类的子库;
检索功能:正确性高、易用、检索结果的办理能力;解析功能
第三章信息资源的分类
:印刷型、缩微型、声像型、机读型

零次文件:口头信息、未公开公布的文字资料(手稿、书信、笔
记等);时效性强;大量而无序;
一次文件:期刊论文、专利文件、科技报告、会议录等;研究人
员最后索取的文件;
二次文件:检索工具:如SCI、EI、CA、PubMed/Medline
三次文件:采用大量相关的文章,经过综合、解析、研究而编写
出来的文件;如:综述、讨论、议论、进展、动向等;研究人员最后
需要的文件。
科研人员与科学信息的获取和利用:
研究人员的文件平台能够由二次文件作为入口,满足整体的需求;
尔后,经过这个入口来获取适用的高质量的全文期刊(一、三次文件)
来满足纵深对的研究需要。
(1)
1)科技图书Books(Monograph,Anthology,Textbook,Reference
book):内容系统成熟可靠,奇特性较差;学****教育之用。
2)科技期刊Periodical(Journal,magazine,serial):数量大,覆盖
面广,内容奇特,及时;交流,影响广泛,信息价值高。
3)报纸(Newspaper):初版周期更短;获取实事性、政策性信息。
4)政府初版物(GovernmentPublications):源自官方、声威、可
靠、价廉;可获取政策性、法规性及科技信息。
5)科技报告(Sci/TechReport):反响前沿科技、内容奇特、有密
级控制。如:美国政府四大科技报告:PB,AD,NASA,DOE报告。
6)专利文件(PatentDocument,Patentspecification/bulletin/aids):
种类有:专利说明书、专利公报、专利分类表、专利文摘等检索工具。
反响新的技术发明,是重要的技术、经济信息源。
7)会议文件(Conferencepaper,Proceedings):会商论文集,回忆
录,会议资料等;反响最新成就,最新动向,高水平,前沿发展动向。
8)学位论文(Dissertations\Thesis);内容专深,非卖品,有较
高学术参照价值。
9)标准文件(Standards):反响成熟技术,掌握技术政策,技
术水平,可供研究新产品,改造老产品,改进工艺和操作水平是借鉴。
10)产品资料:形象、直观、奇特、可认识工业水平、产品发
展、市场动向等。
11)广告(Advertisement):可及时掌握竞争对手最新推出的产
品品种,市场卖点。正确掌握个地域市场的广告竞争态势。
12)技术档案和图纸:技术性,合用性,保密性。
:依照检索需求而编制的检索系统储藏与检索共同使用
的人工约定语言。
分类:系统分类语言、标题词语言、要点词语言、叙词语言。
:又称检索点,指利用信息的各种内外特点,作为检索
出发点,从不相同角度来检索信息。有:
分类(Classified):所属学科分类
主题(Subject):所属主题内容、要点词
着者(Author):集体着者(CorporateAuthor)
名称,题目(Title)
代码(Code)
(1)
逻辑算符“与”:and或*
例:telecommutandproductiv
逻辑算符“或”:or或+
例:computerormicrocomputer
逻辑算符“非”:not或—
例:aspartamenotbeverage
(2):截词符
用于解决一些词干相同、词义周边、但词尾或词头不一致的派生
词(如有同一词根派生出的名词、动名词、动词、形容词、副词等),
或名词的单、复数形式,或痛一次的英美不相同拼写形式等词的一次输
入。
PQD平台的截词符用?、*和$表示。
截词符?Nurse?—nursed/nursesad—added/adult/adopt用于
代替某个字词中间或结尾的任何一个字符,不能够代表没有字符。
截词符*control*—control/controlled/controlling代替0-10个
字符
截词符$$5beat—Upbeat/offbeat/heartbeat

限制截词符用

$n
表示,代替0-n个字符。
(3):地址算符(P/n、N/n)
用于限制词与词之间的地址关系,以提高查准率。
当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号分开时,均应使用地址算符。
P/0两个单词中间有一个空格或一个字符,在文件中出现的前后地址
不能够互换。
PolarP/0embedded可检索到:polar-embedded或polarembedded
P/1两个单词中间可能有0-1个单词,在文件中出现的前后地址不能够
互换。
地址算符P/n与地址算符N/n的用法近似,差异在于前后单词是能够
互换的。

在PQD中检索时,系统会自动般配单词的单复数,英美拼写变体,形容词比较级最高等等形式。
:“”(双引号检索短语)
在PQD中可把短语放在引号内进行精确短语检索,但这种检索方式不能够自动般配。
在PQD中,空格默认为逻辑算符and。

格式:字段名(检索词或检索式)
AU(smith)andTI(food):检索标题含有food,作者含有smith
的文章。
多个字段检索时,字段与字段之间用逗号分开
AB,TI(food):检索标题含有food也许大纲含有food的文档。
PQD中,检索式常用限制字段为TI,AB,SU,IF。
PQD中的主题词(SU)字段是系统标引的独立字段。
:指为实现检索目标而拟定的检索计划和方案。检索式
是检索策略的详细表现,是指计算机检索中用来表达用户检索提问的
逻辑表达式,平时由检索词和各种逻辑算符、截词符、地址算符以及
系统规定的其他连接符号等构成。

1)解析检索课题,明确检索要求,确定检索的主题内容、范围

2)确定检索看法
3)选择表达看法的检索词
选择所有不相同的能够表达检索看法的词
使用截词检索各种词尾变化的词
使用地址算符指定词组或词间的相对地址关系4)使用逻辑算符组配检索看法,拟定检索表达式5)选择合适的数据库
6)上机检索

全文链接按钮、全文数据库、馆际互借、图书馆文件传达、免费
全文网站、供给免费全文的期刊,作者E-mail联系或作者主页。
(1)
扩大命中文件量的方法
1)选择其他同义词、相关词、上位词
2)去掉一个不太重要的检索信息
3)将限制慎重的地址算符改为较宽松的地址算符,或经过and
算符代替地址算符
4)取消某些限制过严的后缀符、限制符等
5)增加检索路子,将主题路子与非主题路子结合起来使用
6)利用截词技术,检索所有相同词干的词
7)用E指令扩词以核实拼写
8)选择其他数据库进行检索
(2)
减小命中文件量的方法
1)提高检索式的专指度,增加或换用下位词和专指度较强的

2)增加一个检索看法
3)将检索式中的and算符改为地址算符;或将较宽松的地址
算符改为更慎重的地址算符
4)使用后缀限制,将检索词限制在基本索引的“重要”字段
中,如规范词字段或题目字段
5)用协助索引的某些字段与主题索引组结合限制检索范围
6)截词使用不当

SCI(ScienceCitationIndex)
SCI-E(ScienceCitationIndexExpanded)科学引文索引
SSCI(SocialScienceCitationIndex)社会科学引文索引
A&HCI(Arts&HumanitiesCitationIndex)艺术与人文引文
索引
CPCI(ConferenceProceedingsCitationIndex)
CPCI-S(ConferenceProceedingsCitationIndex-Science)科学
会议
CPCI-SSH(ConferenceProceedingsCitationIndex-Social
ScienceCitationIndex)社会科学与人文艺术会议
EI(TheEngineeringIndex)工程索引

SCI最能反响基础学科研究水平和论文质量
检索系统收录的科技期刊比较全面
集中各学科高质量优秀论文的精华
成为世界科技亲近凝望的中心和焦点
CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相
对要宽松
CPCI是一种综合性的科技会议文件检索刊物,该检索工具收录包
括自然科学、技术科学以及历史与哲学等,覆盖的学科范围广,收录
会议文件齐全,而且检索路子多,初版速度快。易成为了检索全世界
正式初版的会议文件的主要的和声威的工具。

NEAR/x:NEAR代表所链接的两个词之间的词语数量小于等于
N,默认的使用Near的缺省值是15。
SAME:要求两个检索词是在一个检索字段中。YaleSAMEhosp

WebofScience数据库中能够对检索结果依照以下方式进行研究: