1 / 20
文档名称:

哈夫曼编码译码器实验报告材料.docx

格式:docx   大小:256KB   页数:20页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

哈夫曼编码译码器实验报告材料.docx

上传人:cjl201702 2021/11/9 文件大小:256 KB

下载得到文件列表

哈夫曼编码译码器实验报告材料.docx

文档介绍

文档介绍:实用文档
文案大全
问题解析与解题方法
问题分析:
设计一个哈夫曼编码、译码系统。对一个 ASCII编码的文本文件中的字符进行哈夫曼 编码,生成编码文件;反过来,可将编码文件译码还原为一个文本文件。
从文件中读入任意一篇英文短文(文件为 ASCII编码,扩展名为txt);
统计并输出不同字符在文章中出现的频率(空格、换行、标点等也按字符处理) ;
根据字符频率构造哈夫曼树,并给出每个字符的哈夫曼编码;
将文本文件利用哈夫曼树进行编码,存储成压缩文件(编码文件后缀名 .huf)
用哈夫曼编码来存储文件,并和输入文本文件大小进行比较,计算文件压缩率;
进行译码,将huf文件译码为ASCII编码的txt文件,与原txt文件进行比较。
根据上述过程可以知道该编码译码器的关键在于字符统计和哈夫曼树的创建以及解
码。
哈夫曼树的理论创建过程如下:
一、构成初始集合
对给定的n个权值{W1,W2,W3,…,Wi,...,Wn}构成n棵二叉树的初始集合
F={T1,T2,T3,...,Ti,...,Tn},其中每棵二叉树 Ti中只有一个权值为 Wi的根结点,它 的左右子树均为空。
二、选取左右子树
在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树 的根结点的权值为其左右子树的根结点的权值之和。
三、删除左右子树
从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合 F中。
四、重复二和三两步,
重复二和三两步,直到集合 F中只有一棵二叉树为止。
因此,有如下分析:
.我们需要一个功能函数对 ASCII码的初始化并需要一个数组来保存它们;
.定义代表森林的数组, 在创建哈夫曼树的过程当中保存被选中的字符, 即给定报文
中出现的字符,模拟哈夫曼树选取和删除左右子树的过程;
.自底而上地创建哈夫曼树, 保存根的地址和每个叶节点的地址, 即字符的地址,然
后自底而上检索,首尾对换调整为哈夫曼树实现哈弗曼编码;
.从哈弗曼编码文件当中读入字符,根据当前字符为0或者1的状况访问左子树或者 右孩子,实现解码;
.使用文件读写操作哈夫曼编码和解码结果的写入;
解题方法:
结构体、数组、类的定义:
.定义结构体类型的signode作为哈夫曼树的节点, 定义结构体类型的 hufnode作为 哈夫曼编码对照表的节点,定义
实用文档
文案大全
HFM类实现对哈夫曼树的创建,利用其成员函数 完成哈夫曼编码译码的工作。
.定义signode类型的全局数组 SN[256](为方便调用,之后的 forest[256],
hufNode[256]均为全局数组),保存ASCII编码的字符,是否在文章中出现( bool 类型)以及出现次数(int类型,权重),左右孩子节点位置,父节点位置信息;
.为节省存储空间,定义 signode *类型的全局数组 forest[256],模拟森林,在创建 哈夫曼树的过程中保存出现字符的指针,模拟哈夫曼树选取和删除左右子树的过 程;
.定义hufnode类型的全局数组hufNode[256],在编码时最为哈夫曼编码对照表的节 点,char型c保存字符,int code[100]保存其哈夫曼编码;
.定义HFM类,主要保存哈夫曼树的根节点指针,但其丰富的功能函数将实现哈夫 曼编码译码的工作及其他功能;
函数介绍:
void init(signode * sig){ }初始化数组 SN口;
void compress(){ }输出压缩对比情况的信息 ;
void exchange(){ }用两层for循环实现hufNode[i]节点的成员哈夫曼编码数组
code□前后元素的对换,因为在之前的编码过程中由于是从叶节点追溯至根节点, 存入code数组的哈夫曼编码与哈夫曼编码的概念反向,故而要调整;
signode * getroot(){ }返回哈夫曼树的根节点指针;
signode * HFM::creat(){ }创建哈夫曼树,首先用三个 for循环查看forest数组,
找到权值最小的两个字符,以 int型的min1,min2记录其下标,定义 signode *类 型指针pp指向新生成 signode节点,用指针操作使 pp指向的节点的权值为
min1,min2权值之和,pp做孩子指向 forest[min1],右孩子指向 forest[min2],
min1,min2的父指针指向pp,然后将pp存入mini的位置,min2之后的每一个节 点依次往前移一个位置,实现从 forest数组中清除min1,min2并加入pp的操作;
void HFM::hufcode(){ }哈夫曼编码,用