C++哈夫曼树编码和译码的实现

一.背景介绍:

  给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

二.实现步骤:

  1.构造一棵哈夫曼树

  2.根据创建好的哈夫曼树创建一张哈夫曼编码表

  3.输入一串哈夫曼序列,输出原始字符

三.设计思想:

  1.首先要构造一棵哈夫曼树,哈夫曼树的结点结构包括权值,双亲,左右孩子;假如由n个字符来构造一棵哈夫曼树,则共有结点2n-1个;在构造前,先初始化,初始化操作是把双亲,左右孩子的下标值都赋为0;然后依次输入每个结点的权值

2.第二步是通过n-1次循环,每次先找输入的权值中最小的两个结点,把这两个结点的权值相加赋给一个新结点,,并且这个新结点的左孩子是权值最小的结点,右孩子是权值第二小的结点;鉴于上述找到的结点都是双亲为0的结点,为了下次能正确寻找到剩下结点中权值最小的两个结点,每次循环要把找的权值最小的两个结点的双亲赋值不为0(i).就这样通过n-1循环下、操作,创建了一棵哈夫曼树,其中,前n个结点是叶子(输入的字符结点)后n-1个是度为2的结点

3.编码的思想是逆序编码,从叶子结点出发,向上回溯,如果该结点是回溯到上一个结点的左孩子,则在记录编码的数组里存“0”,否则存“1”,注意是倒着存;直到遇到根结点(结点双亲为0),每一次循环编码到根结点,把编码存在编码表中,然后开始编码下一个字符(叶子)

4.译码的思想是循环读入一串哈夫曼序列,读到“0”从根结点的左孩子继续读,读到“1”从右孩子继续,如果读到一个结点的左孩子和右孩子是否都为0,如果是说明已经读到了一个叶子(字符),翻译一个字符成功,把该叶子结点代表的字符存在一个存储翻译字符的数组中,然后继续从根结点开始读,直到读完这串哈夫曼序列,遇到结束符便退出翻译循环

四.源代码:

  1 /***************************************
  2 目的:1.根据输入的字符代码集及其权值集,
  3 构造赫夫曼树,输出各字符的赫夫曼编码
  4 2.输入赫夫曼码序列,输出原始字符代码
  5 作者:曾凯  时间:2016-11-11
  6 ****************************************/
  7 #include<iostream>
  8 #define MAX_MA 1000
  9 #define MAX_ZF 100
 10 using namespace std;
 11
 12 //哈夫曼树的储存表示
 13 typedef struct
 14 {
 15     int weight;  //结点的权值
 16     int parent, lchild, rchild;//双亲,左孩子,右孩子的下标
 17 }HTNode,*HuffmanTree;  //动态分配数组来储存哈夫曼树的结点
 18
 19 //哈夫曼编码表的储存表示
 20 typedef char **HuffmanCode;//动态分配数组存储哈夫曼编码
 21
 22 //返回两个双亲域为0且权值最小的点的下标
 23 void Select(HuffmanTree HT, int n, int &s1, int &s2)
 24 {
 25     /*n代表HT数组的长度
 26     */
 27
 28    //前两个for循环找所有结点中权值最小的点(字符)
 29     for (int i = 1; i <= n; i++)
 30     {//利用for循环找出一个双亲为0的结点
 31         if (HT[i].parent == 0)
 32         {
 33             s1 = i;//s1初始化为i
 34             break;//找到一个后立即退出循环
 35         }
 36     }
 37     for (int i = 1; i <= n; i++)
 38     {/*利用for循环找到所有结点(字符)权值最小的一个
 39      并且保证该结点的双亲为0*/
 40         if (HT[i].weight < HT[s1].weight && HT[i].parent == 0)
 41             s1 = i;
 42     }
 43     //后两个for循环所有结点中权值第二小的点(字符)
 44     for (int i = 1; i <= n; i++)
 45     {//利用for循环找出一个双亲为0的结点,并且不能是s1
 46         if (HT[i].parent == 0 && i != s1)
 47         {
 48             s2 = i;//s2初始化为i
 49             break;//找到一个后立即退出循环
 50         }
 51     }
 52
 53     for (int i = 1; i <= n; i++)
 54     {/*利用for循环找到所有结点(字符)权值第二小的一个,
 55      该结点满足不能是s1且双亲是0*/
 56         if (HT[i].weight < HT[s2].weight && HT[i].parent == 0 && i!= s1)
 57             s2 = i;
 58     }
 59
 60 }
 61
 62 //构造哈夫曼树
 63 void CreateHuffmanTree(HuffmanTree &HT, int n)
 64 {
 65 /*-----------初始化工作-------------------------*/
 66     if (n <= 1)
 67         return;
 68     int m = 2 * n - 1;
 69     HT = new HTNode[m + 1];
 70     for (int i = 1; i <= m; ++i)
 71     {//将1~m号单元中的双亲,左孩子,右孩子的下标都初始化为0
 72         HT[i].parent = 0; HT[i].lchild = 0; HT[i].rchild = 0;
 73     }
 74     for (int i = 1; i <= n; ++i)
 75     {
 76         cin >> HT[i].weight;//输入前n个单元中叶子结点的权值
 77     }
 78 /*-----------创建工作---------------------------*/
 79     int s1,s2;
 80     for (int i = n + 1; i <= m; ++i)
 81     {//通过n-1次的选择,删除,合并来构造哈夫曼树
 82         Select(HT, i - 1, s1, s2);
 83         /*cout << HT[s1].weight << " , " << HT[s2].weight << endl;*/
 84         /*将s1,s2的双亲域由0改为i
 85         (相当于把这两个结点删除了,这两个结点不再参与Select()函数)*/
 86         HT[s1].parent = i;
 87         HT[s2].parent = i;
 88         //s1,与s2分别作为i的左右孩子
 89         HT[i].lchild = s1;
 90         HT[i].rchild = s2;
 91         //结点i的权值为s1,s2权值之和
 92         HT[i].weight = HT[s1].weight + HT[s2].weight;
 93     }
 94 }
 95
 96 //从叶子到根逆向求每个字符的哈夫曼编码,储存在编码表HC中
 97 void CreatHuffmanCode(HuffmanTree HT, HuffmanCode &HC, int n)
 98 {
 99     HC = new char*[n + 1];//分配储存n个字符编码的编码表空间
100     char *cd = new char[n];//分配临时存储字符编码的动态空间
101     cd[n - 1] = ‘\0‘;//编码结束符
102     for (int i = 1; i <= n; i++)//逐个求字符编码
103     {
104         int start = n - 1;//start 开始指向最后,即编码结束符位置
105         int c = i;
106         int f = HT[c].parent;//f指向结点c的双亲
107         while (f != 0)//从叶子结点开始回溯,直到根结点
108         {
109             --start;//回溯一次,start向前指向一个位置
110             if (HT[f].lchild == c) cd[start] = ‘0‘;//结点c是f的左孩子,则cd[start] = 0;
111             else cd[start] = ‘1‘;//否则c是f的右孩子,cd[start] = 1
112             c = f;
113             f = HT[f].parent;//继续向上回溯
114         }
115         HC[i] = new char[n - start];//为第i个字符编码分配空间
116         strcpy(HC[i], &cd[start]);//把求得编码的首地址从cd[start]复制到HC的当前行中
117     }
118     delete cd;
119 }
120
121 //哈夫曼译码
122 void TranCode(HuffmanTree HT,char a[],char zf[],char b[],int n)
123 {
124     /*
125     HT是已经创建好的哈夫曼树
126     a[]用来传入二进制编码
127     b[]用来记录译出的字符
128     zf[]是与哈夫曼树的叶子对应的字符(叶子下标与字符下标对应)
129     n是字符个数,相当于zf[]数组得长度
130     */
131
132     int q = 2*n-1;//q初始化为根结点的下标
133     int k = 0;//记录存储译出字符数组的下标
134     int i = 0;
135     for (i = 0; a[i] != ‘\0‘;i++)
136     {//for循环结束条件是读入的字符是结束符(二进制编码)
137         //此代码块用来判断读入的二进制字符是0还是1
138         if (a[i] == ‘0‘)
139         {/*读入0,把根结点(HT[q])的左孩子的下标值赋给q
140          下次循环的时候把HT[q]的左孩子作为新的根结点*/
141             q = HT[q].lchild;
142         }
143         else if (a[i] == ‘1‘)
144         {
145             q = HT[q].rchild;
146         }
147         //此代码块用来判断HT[q]是否为叶子结点
148         if (HT[q].lchild == 0 && HT[q].rchild == 0)
149         {/*是叶子结点,说明已经译出一个字符
150         该字符的下标就是找到的叶子结点的下标*/
151             b[k++] = zf[q];//把下标为q的字符赋给字符数组b[]
152             q = 2 * n - 1;//初始化q为根结点的下标
153             //继续译下一个字符的时候从哈夫曼树的根结点开始
154         }
155     }
156     /*译码完成之后,用来记录译出字符的数组由于没有结束符输出的
157     时候回报错,故紧接着把一个结束符加到数组最后*/
158     b[k] = ‘\0‘;
159 }
160 //菜单函数
161 void menu()
162 {
163     cout << endl;
164     cout << "       ┏〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓┓" << endl;
165     cout << "       ┃      ★★★★★★★哈夫曼编码与译码★★★★★★★        ┃" << endl;
166     cout << "       ┃                   1.  创建哈夫曼树                       ┃" << endl;
167     cout << "       ┃                   2.  进行哈夫曼编码                     ┃" << endl;
168     cout << "       ┃                   3.  进行哈夫曼译码                     ┃" << endl;
169     cout << "       ┃                   4.  退出程序                           ┃" << endl;
170     cout << "       ┗〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓┛" << endl;
171     cout << "                       <><注意:空格字符用‘- ‘代替><>" << endl;
172     cout << endl;
173 }
174 void main()
175 {
176     int falg;//记录要编码的字符个数
177     char a[MAX_MA];//储存输入的二进制字符
178     char b[MAX_ZF];//存储译出的字符
179     char zf[MAX_ZF];//储存要编码的字符
180     HuffmanTree HT = NULL;//初始化树为空数
181     HuffmanCode HC = NULL;//初始化编码表为空表
182     menu();
183     while (true)
184     {
185         int num;
186         cout << "<><请选择功能(1-创建 2-编码 3-译码 4-退出)><>: ";
187             cin >> num;
188             switch (num)
189             {
190             case 1 :
191                 cout << "<><请输入字符个数><>:";
192                 cin >> falg;
193                 //动态申请falg个长度的字符数组,用来存储要编码的字符
194                 /*char *zf = new char[falg];*/
195                 cout << "<><请依次输入" << falg << "个字符:><>: ";
196                 for (int i = 1; i <= falg; i++)
197                     cin >> zf[i];
198                 cout << "<><请依次输入" << falg << "个字符的权值><>: ";
199                 CreateHuffmanTree(HT, falg);//调用创建哈夫曼树的函数
200                 cout << endl;
201                 cout << "<><创建哈夫曼成功!,下面是该哈夫曼树的参数输出><>:" << endl;
202                 cout << endl;
203                 cout << "结点i"<<"\t"<<"字符" << "\t" << "权值" << "\t" << "双亲" << "\t" << "左孩子" << "\t" << "右孩子" << endl;
204                 for (int i = 1; i <= falg * 2 - 1; i++)
205                 {
206                     cout << i << "\t"<<zf[i]<< "\t" << HT[i].weight << "\t" << HT[i].parent << "\t" << HT[i].lchild << "\t" << HT[i].rchild << endl;
207                 }
208                 cout << endl;
209                 break;
210             case 2:
211                 CreatHuffmanCode(HT, HC, falg);//调用创建哈夫曼编码表的函数
212                 cout << endl;
213                 cout << "<><生成哈夫曼编码表成功!,下面是该编码表的输出><>:" << endl;
214                 cout << endl;
215                 cout << "结点i"<<"\t"<<"字符" << "\t" << "权值" << "\t" << "编码" << endl;
216                 for (int i = 1; i <= falg; i++)
217                 {
218                     cout << i << "\t"<<zf[i]<< "\t" << HT[i].weight << "\t" << HC[i] << endl;
219                 }
220                 cout << endl;
221                 break;
222             case 3:
223                 cout << "<><请输入想要翻译的一串二进制编码><>:";
224                 /*这样可以动态的直接输入一串二进制编码,
225                 因为这样输入时最后系统会自动加一个结束符*/
226                 cin >> a;
227                 TranCode(HT, a, zf, b, falg);//调用译码的函数,
228                  /*这样可以直接把数组b输出,因为最后有
229                  在数组b添加输出时遇到结束符会结束输出*/
230                 cout << endl;
231                 cout << "<><译码成功!翻译结果为><>:" << b << endl;
232                 cout << endl;
233                 break;
234             case 4:
235                 cout << endl;
236                 cout << "<><退出成功!><>" << endl;
237                 exit(0);
238             default:
239                 break;
240             }
241     }
242
243     //-abcdefghijklmnopqrstuvwxyz
244     //186 64 13 22 32 103 21 15 47 57 1 5 32 20 57 63 15 1 48 51 80 23 8 18 1 16 1
245     //000101010111101111001111110001100100101011110110
246
247 }

五.运行截图:

时间: 2024-12-25 14:27:54

C++哈夫曼树编码和译码的实现的相关文章

看数据结构写代码(32) 赫夫曼树编码以及译码

杂谈:最近有点慵懒,不好不好.好几天都没写代码,原本准备上星期完结 树 这一章节的.现在 又耽误了.哎.要抓紧时间啊. 下面直接上代码: 可以到我的网盘下载源代码,或者 直接拷贝下面的源代码 运行 网盘地址:点击打开链接 // HuffmanTree.cpp : 定义控制台应用程序的入口点. //哈弗曼编码,译码 #include "stdafx.h" #include <stdlib.h> #include <cstring> enum E_State { E

赫夫曼树编码的表示与实现--自己写数据结构

头文件huffman.h #ifndef _HUFFMAN_H_ #define _HUFFMAN_H_ #define MAX_WEIGHT 10000 typedef struct _HTNode { int weight; int parent,lchild,rchild; char data; }HTNode,*pHTNode; typedef char** huffmancode; void select_min_weight(HTNode* btree,int mn,int* s1,

20172303 2018-2019-1《程序设计与数据结构》哈夫曼树编码与解码

20172303 2018-2019-1<程序设计与数据结构>哈夫曼树编码与解码 哈夫曼树简介 定义:给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近. 带权路径长度(Weighted Path Length of Tree,简记为WPL) 结点的权:在一些应用中,赋予树中结点的一个有某种意义的实数. 结点的带权路径长度:结点到树根之间的路径长度与

文件压缩——哈夫曼树编码(一)

何谓哈夫曼树?-- 百度百科:给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近. 哈夫曼树的应用?-- 哈夫曼编码 与 哈夫曼译码. 哈夫曼树为基础的项目?-- 文件压缩. 文件压缩分两种:1.有损压缩.2.无损压缩. 哈夫曼树为核心算法的压缩方式是无损压缩. 其实我们windows常用的zip类型的压缩包底层,哈夫曼树就是核心算法之一(当然不全是)

赫夫曼树编码

在一般的数据结构的书中,树的那章后面,著者一般都会介绍一下哈夫曼(HUFFMAN) 树和哈夫曼编码.哈夫曼编码是哈夫曼树的一个应用.哈夫曼编码应用广泛,如 JPEG中就应用了哈夫曼编码. 首先介绍什么是哈夫曼树.哈夫曼树又称最优二叉树, 是一种带权路径长度最短的二叉树.所谓树的带权路径长度,就是树中所有的叶结点 的权值乘上其到根结点的 路径长度(若根结点为0层,叶结点到根结点的路径长度 为叶结点的层数).树的带权路径长度记为WPL= (W1*L1+W2*L2+W3*L3+...+Wn*Ln) ,

赫夫曼树编码解码实例(C)

//HuffmanTree.h #include <stdlib.h> #include <stdio.h> #include <string.h> #define OVERFLOW -1 typedef struct{ char data; //节点所存字符 unsigned int weight; //节点权重 unsigned int parent,lchild,rchild; }HTNode, *HuffmanTree; //动态分配数组存储赫夫曼树 typed

哈夫曼树的编码实验

Java哈夫曼编码实验--哈夫曼树的建立,编码与解码 建树,造树,编码,解码 一.哈夫曼树编码介绍 1.哈夫曼树: (1)定义:假设有n个权值{w1, w2, ..., wn},试构造一棵含有n个叶子结点的二叉树,每个叶子节点带权威wi,则其中带权路径长度WPL最小的二叉树叫做最优二叉树或者哈夫曼树. (2)特点:哈夫曼树中没有度为1的结点,故由n0 = n2+1以及m= n0+n1+n2,n1=0可推出m=2*n0-1,即一棵有n个叶子节点的哈夫曼树共有2n-1个节点. 2.哈夫曼编码步骤:

数据结构之哈夫曼树

#include <iostream> #include <iomanip> #include <string> using namespace std; typedef struct { string name; int weight; int parent, lchild, rchild; int visited; //设置visited选项来表示每次查找最小权值后的删除,0代表未删除,1表示删除 }HTNode,*HuffmanTree; int Min(Huff

赫夫曼树的构建、编码、译码解析

当你開始看这篇博文的时候.我相信你对树及二叉树的基本概念已有所了解.我在这里就不再赘述. 我们主要对赫 夫曼树的特点.构建.编码.译码做一个具体的介绍,并附有代码,全部函数代码都通过了測试.我不保证全部代码是最优的(毕竟是我一个人苦思冥想出来的,我相信在大家的集思广益之下还有优化的空间),但我保证全部代码是正确的. 一.赫夫曼树的特点 赫夫曼树又称作最优二叉树,是一类带权路径长度最短的树. 首先给出路径和路径长度的概念.从树中一个节点到 还有一个节点之间的分支构成这两个节点之间的路径.路径上的分