1 / 4
文档名称:

数据格式说明手册.doc

格式:doc   大小:141KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据格式说明手册.doc

上传人:daoqqzhuanyongyou2 2018/8/15 文件大小:141 KB

下载得到文件列表

数据格式说明手册.doc

相关文档

文档介绍

文档介绍:简要SCUT-COUCH数据格式说明手册
HCII Laboratory SCUT
华南理工大学
人机通信智能接口实验室
/
-COUCH数据库详细说明
-COUCH数据文件命名规则
每套COUCH数据由两个文件名相同,扩展名不同的文件组成。扩展名分别idx和dat。其中,dat文件为实际的数据文件,idx文件是dat文件的索引文件。每个文件名(除去扩展名)的命名遵循如下格式“数据集名+下划线+编号”。其中数据集名为“Big5”,“Digit”,“GB1”,“GB2”, “Letter”,“Pinyin”,“Symbol”,“TradGB1”,“WORD17366”,“WORD44208”和“WORD8888”中的一个;编号代表该文件在相应数据集的套数编号,由三位阿拉伯数字组成。例如“WORD44208_001”代表SCUT-COUCH2009数据库中WORD44208数据集中的第1套数据,同时它包括两个文件:“”和“。

每套样本数据均由一个索引文件(扩展名为idx,我们称为IDX文件)和一个数据文件(扩展名为dat,我们称为DAT文件)组成。

IDX文件格式由表1所示,IDX文件由文件头和索引单元两种结构组成。每种结构均为固定大小。
表1 IDX文件存储结构
文件头
样本0索引单元
样本1索引单元
···
样本N索引单元
IDX文件头格式如表2所示。文件头单元位于文件起始位置,只有一个long型字段,它的值等于本套数据文件存储的样本总数。
表2 IDX文件头格式
数据名
数据类型
数据长度(Byte)
描述
SampleSum
long
4
本套数据文件的样本总数
IDX文件索引单元格式如表3所示。每个样本的索引单元固定大小为13个字节,共4个数据字段。其中IDX文件中索引单元的个数与相应DAT文件中的样本数量是相同的。
表3 IDX文件样本索引单元格式
数据名
数据类型
数据长度(Byte)
描述
SampleState
unsigned char
1
Hcii-lab保留使用
OswIndex
int
4
Hcii-lab保留使用
IdxIndex
int
4
样本在本套数据中的编号,从0开始计数
DatOffset
long
4
样本数据单元在对应DAT文件中的偏移位置

DAT文件存储结构由表4所示,由各个样本数据单元构成,每个数据单元大小不定长,具体结构如表5所示。
表4 DAT文件存储结构
样本0数据单元
样本1数据单元
样本2数据单元
···
样本N数据单元
表5 DAT文件数据单元格式
数据名
数据类型
数据长度(Byte)
描述
WordLength
unsigned char
1
样本内码长度,字节为单位
WordCode
unsigned char [ ]
WordLength×1
样本的内码
PointNum
unsigned short int
2
样本的点的个数
LineNum
unsig