1 / 30
文档名称:

B使用说明书.pdf

格式:pdf   大小:11,790KB   页数:30页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

B使用说明书.pdf

上传人:2112770869 2016/11/8 文件大小:11.51 MB

下载得到文件列表

B使用说明书.pdf

文档介绍

文档介绍:0书目共现分析系统(BibliographicItemsCo-occurrenceMatrixBuilder,)使用说明书中国医科大学医学信息学系开发沈阳市弘盛计算机技术有限公司协作开发2014年1月0目录前言…………………………………………………1安装…………………………………………………2运行…………………………………………………3数据收集……………………………………………4建立项目……………………………………………13提取字段……………………………………………15频数统计……………………………………………21矩阵生成……………………………………………23词篇矩阵…………………………………………23共现矩阵…………………………………………23附录…………………………………………………26SPSS聚类分析…………………………………………261前言生物医学文献正在爆炸式的增长,同时随着网络技术和文献电子化的发展,书目文献数据库中收集了巨大数量的文献信息,单凭人工在浩瀚的文献海洋中发现和获得自己需要的信息变得困难重重,但这也同时为生物医学文本挖掘提供了广阔的舞台。《书目共现分析系统》(BibliographicItemsCo-occurrenceMatrixBuilder,B)便是在此背景下应运而生。该软件系统由中国卫生政策支持项目(HPSP)资助开发,后又受中国医科大学《“十二五”医学教育科学研究课题》,采用目前技术成熟、流行的数据库语言开发,可对医学文献数据库中的书目信息进行快速读取、准确提取字段并归类存储、统计,并生成书目数据的共现矩阵,为进一步研究提供全面、准确、权威的基础数据。作为文本挖掘的基础工具,B可对国际上权威的生物医学文献数据库PubMed、引文数据库ScienceCitationIndex(SCI)、KI)和万方数据等数据库的文献记录进行读取分析,并允许用户对系统功能进行修改、增加等拓展。本软件系统作为文本挖掘的基础工具,希望在情报分析中得到广泛而充分的应用,为生物医学及其他学科的研究开展做出贡献。2安装一、电脑的准备:软件系统在安装了Windows98/2000/NT/XP/Visat等操作系统的电脑上均可正常运行。不建议使用WindowsME/2003等版本。另外,电脑中需要具备MicrosoftOffice办公软件系统。在统计功能中,B的结果将利用MicroSoftExcel生成报表。软件系统的界面包含Flash动画,要求操作系统中Flash版本在8以上。(浏览如新浪网,可以正常看到网页中的动画,就说明是在Flash8以上)。二、软件的安装:下载的两个文件(B2,bde-install),解压缩后,先运行一遍bde-install,布置好环境,B2即可。3运行在安装的软件系统目录中选择“”文件运行。系统主界面(见图2-1)包括:系统引导区(左侧)以及工作区(右侧)。图2-1系统引导区:显示系统名称、开发方信息以及动画形式的主功能(项目、提取、统计、矩阵等4项)菜单等内容。工作区:以步骤形式分页显示各主功能对应的详细功能内容。在接下来的章节将详细介绍各主功能项的详细功能内容以及操作方法。4数据收集数据收集分为检索和下载两个步骤。检索过程即为找到切题的文献。目前按照业务需求,软件系统可对<txt>、<xml>两种格式的文件类型进行指定内容的提取工作。<txt>格式类型的文件(图3-2)是标准的ANSI编码的纯文本格式文件,软件系统通过遍历文档,查找每行文字的前面的特征字符(图3-1中的{Author}等统一格式的字段名称)来提取其后面的内容信息(如图3-1中的王超)。因此下载数据时要选择规定的格式,以便符合软件系统的要求。图3-1<txt>格式的文献记录<xml>格式类型的文件是一种以“树”状结构形式存储数据的纯文本格式文件。软件系统要提取的就是“树”上指定“节点”上的“叶子”。图3-2就是图3-1同一篇文章的xml格式。图3-2<xml>格式的文献记录5一、,点击右侧上方的下拉菜单,可以将检索结果发送到本地计算机(如图3-3)。图3-,,在“sendto”下拉菜单的选项中,依次在“ChooseDestination”中选择“file”,“Format”中选择“XML”,其余选项可任意选择(如图3-4)。图3--3中的“CreateFile”按钮,选定保存路径和文件名称,将文献保存到本地磁盘中(图63-4)。图3-5为用写字板打开的下载文件。图3-4