文档介绍:Coreseek
本文档修订历史:
版本号
修订人
修订说明
-
王靖
新增查询参数,用于过滤指定属性在指定值或指定范围(值须为整数)的结果
-
王靖
新增重建主增索引、程序日志文件、系统计划任务crontab 说明
-
王靖
新建
目录
一、 功能描述 2
二、 系统架构 2
三、 内容源数据提交接口 2
1. 接口url及参数构造说明 2
1) 请求url 2
2) 请求参数列表 3
3) 提交数据说明 3
2. 返回结果 4
四、 查询API接口 4
1. 请求参数说明 4
1) 请求url 4
2) 请求参数列表 4
2. 返回结果 5
五、 搜索接口相关软件安装及配置 5
1. coreseek (搜索)及mmseg(分词) 5
2. httpsqs (队列) 6
3. 安装tokyotyrant ( 数据库网络服务接口) 7
4. 重建主索引及增量索引 8
5. 日志文件说明 9
6. 系统计划任务crontab 10
功能描述
基于coreseek的搜索引擎接口,可实时对内容源提交的数据建立中文全文索引,实现准实时(2分钟内)、高速、精准搜索全站内容。并支持返回json格式数据的API查询接口。
系统架构
内容源数据提交接口
接口url及参数构造说明
请求url
./datasource/?act=put&sourcename=cmstop
sourcename : 代表内容来源,必填,默认值为cmstop。sourcename 的值由接口定义及分配,提交数据前请先获取该值。
act=put,必填,代表内容将进入搜索索引队列,否则将提示:no act。
请求参数列表
参数
参数名称
类型
参数说明
是否空
contentid
内容id
int
内容源唯一id
不可
title
标题
string
建索引字段
不可
content
内容
string
建索引字段
不可
description
内容摘要
string
建索引字段
可空
author
作者
string
建索引字段
可空
tagname
标签名称
string
建索引字段。多值用半角英文逗号隔开
可空
tagid
标签id
string
多值用半角英文逗号隔开,tagid顺序和tagname顺序一致。可用于筛选。值由接口定义分配,提交数据前请先获取该值。
可空
editor
编辑
string
编辑。
可空
weights
权重
int
内容的权重,可用于筛选。
可空
url
链接地址
string
访问内容http网址
不可
thumb
缩略图地址
string
图片存储的绝对地址
不可
catid
分类id
int
内容分类或栏目id,可用于筛选。值由接口定义分配,提交数据前请先获取该值。
可空
modelid
内容类型id
int
内容类型,如文章,组图,视频,专题。可用于筛选