文档介绍:TRS 培训总结交流
2017/11/25
TRS 原理
全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。TRS Server是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。
2017/11/25
体系结构
数据库服务器
管理
员工具
网关或适配器
开发包
内容发布应用服务器
TRS 软件平台介绍
一、 TRS Server全文数据库系统
二、 TRS 全文检索网关(DB2)
三、TRS 全文检索网关(Oracle)
四、TRS全文检索网关(MS SQL)
五、TRS企业搜索应用适配器-File
六、TRS全文数据库API
2017/11/25
----
----
----
----
----
----JAVA包
一、 TRS Server全文数据库系统
TRS全文数据库服务器的核心技术为全文检索全文数据库=全文检索+关系数据库的基本关系特征+Native-XML数据库特性;
核心功能:对结构化和非结构化信息的统一存储管理;基于元数据和全文的联合查询。
2017/11/25
管理员工具的作用
TRS管理员是TRS信息发布检索系统的客户端管理工具,主要用于对各种TRS对象进行管理、设计和维护等,并具备完整的检索、浏览和维护功能。
启动与退出
[前提条件] :TRS服务器处于启动状态
双击桌面上“TRS管理员工具”图标
输入:
TRS 服务器地址
端口号
用户帐号名
口令字
第一次进入用系统默认管理员帐号名(system) 和口令字(manager)登录
可退出登录并用其他用户的身份重新登陆
用户组:系统安装时,将自动创建两个用户组/用户: administrator/system/和guest/pub。
用户:
数据库----相当于关系型数据库的一张表
视图(视图字段):一个或几个结构完全相同的数据库的集合,这样可以提高查询速度.
视图包含的数据库均以AS$开头;视图包含的数据库有顺序,对视图进行装库,相当于对最后一个数据库装库;当最后一个数据库的记录数超过设定值,视图会自动创建一个新的库。
词典:数据库所用词典,缺省为系统配置中的缺省分词及停用词典名。
文件格式
TRS基本概念:对象
数据库
数据库是TRS系统中的主要数据对象,它物理地存储了用户加载到系统中的所有数据资料。每个TRS系统可管理多达数十亿个数据库。
数据库实际上是一个数据表,表的每一行是一个数据记录,每一列则是一个数据字段,行列的交叉点即为字段值。
数据库字段(1)
TRS数据库有六种类型的字段:
日期型(DATE) ; 数值型(NUMBER);字符串型(CHAR)短语型(PHRASE);全文型(DOCUMENT);二进制型(BIT)
我们可以对CHAR,DATE,NUMBER进行字段级检索,对PHRASE和DOCUMENT进行全文检索,但对BIT字段不进行检索,系统规定BIT字段始终不建索引。
所有的查询操作都是在一定的字段上进行的。每个数据库可定义1到1023个字段。