漫谈C++哈夫曼树的原理及实现

字符	编码
A	00
B	01
C	10
D	11

字符	占比	编码
A	0.5	0
B	0.2	10
C	0.15	110
D	0.1	111

2.从树集合中选择根结点的权值最小的 2 个树。重新构建一棵新二叉树，让刚选择出来的2 棵树的根结点成为这棵新树的左右子结点，新树的根结点的权值为 2 个左右子结点权值的和。构建完成后从树集合中删除原来 2个结点，并把新二叉树放入树集合中。

如下图所示。权值为 3和4的结点为新二叉树的左右子结点，新树根结点的权值为7。

3.重复第二步，直到树集合中只有一个根结点为止。

当集合中只存在一个根结点时，停止构建，并且为最后生成树的每一个非叶子结点的左结点分支标注0，右结点分支标注1。如下图所示：

通过上述从下向上的思想构建出来的二叉树，可以保证权值较小的结点离根结点较远，权值较大的结点离根结点较近。最终二叉树的带权路径长度： WPL=(3+4)*5+6*4+(8+9+12)*3+(21+22)*2=232 。并且此树的带权路径长度是所有可能构建出来的二叉树中最小的。

上述的构建思想即为哈夫曼树设计思想，不同权值的字符编码就是结点路径上0和1的顺序组合。如下表所述，权值越大，其编码越小，权值越小，其编码越大。其编码长度即从根结点到此叶结点的路径长度。

字符	权值	编码
A	3	11110
B	6	1110
C	12	110
D	9	001
E	4	11111
F	8	000
G	21	01
H	22	10

4.>

4.1>

可以把权值不同的结点分别存储在优先队列（Priority Queue）中，并且给与权重较低的结点较高的优先级（Priority）。

具体实现哈夫曼树算法如下：

1.把n个结点存储到优先队列中，则n个节点都有一个优先权Pi。这里是权值越小，优先权越高。

2.如果队列内的节点数>1，则：

从队列中移除两个最小的结点。

产生一个新节点，此节点为队列中移除节点的父节点，且此节点的权重值为两节点之权值之和，把新结点加入队列中。

重复上述过程，最后留在优先队列里的结点为哈夫曼树的根节点（root）。

完整代码：

#include <iostream>
#include <queue>
#include <vector>
using namespace std;
//树结点
struct TreeNode {
	//结点权值
	float weight;
	//左结点
	TreeNode *lelfChild;
	//右结点
	TreeNode *rightChild;
    //初始化
	TreeNode(float w) {
		weight=w;
		lelfChild=NULL;
		rightChild=NULL;
    }
};
//为优先队列提供比较函数
struct comp {
	bool operator() (TreeNode * a, TreeNode * b) {
        //由大到小排列
		return a->weight > b->weight; 
	}
};

//哈夫曼树类
class HfmTree {
	private:
         //优先队列容器
		priority_queue<TreeNode *,vector<TreeNode *>,comp> hfmQueue;
	public:
		//构造函数，构建单根结点树
		HfmTree(int weights[8]) {
			for(int i=0; i<8; i++) {
				//创建不同权值的单根树
				TreeNode *tn=new TreeNode(weights[i]);
				hfmQueue.push(tn);
			}
		}
		//显示队列中的最一个结点
		TreeNode* showHfmRoot() {
			TreeNode *tn;
			while(!hfmQueue.empty()) {
				tn= hfmQueue.top();
				hfmQueue.pop();
			}
			return tn;
		}
		//构建哈夫曼树
		void create() {
             //重复直到队列中只有一个结点
			while(hfmQueue.size()!=1) {
				//从优先队列中找到权值最小的 2 个单根树
				TreeNode *minFirst=hfmQueue.top();
				hfmQueue.pop();
				TreeNode *minSecond=hfmQueue.top();
				hfmQueue.pop();
				//创建新的二叉树
				TreeNode *newRoot=new TreeNode(minFirst->weight+minSecond->weight);
				newRoot->lelfChild=minFirst;
				newRoot->rightChild=minSecond;
				//新二叉树放入队列中
				hfmQueue.push(newRoot);
			}
		}
		//按前序遍历哈夫曼树的所有结点
		void showHfmTree(TreeNode *root) {
			if(root!=NULL) {
				cout<<root->weight<<endl;
				showHfmTree(root->lelfChild);
				showHfmTree(root->rightChild);
			}
		}
		//析构函数
		~HfmTree() {
            //省略
		}
};

//测试
int main(int argc, char** argv) {
	//不同权值的结点
	int weights[8]= {3,6,12,9,4,8,21,22};
    //调用构造函数
	HfmTree hfmTree(weights);
    //创建哈夫曼树
	hfmTree.create();
    //前序方式显示哈夫曼树
	TreeNode *root= hfmTree.showHfmRoot();
	hfmTree.showHfmTree(root);
	return 0;
}

显示结果：

上述输出结果，和前文的演示结果是一样的。

此算法的时间复杂度为O（nlogn）。因为有n个结点，所以树总共有2n-1个节点，使用优先队列每个循环须O（log n）。

4.2>

除了上文的使用优先队列之外，还可以使用一维数组的存储方式实现。

在哈夫曼树中，叶子结点有 n个，非叶子结点有 n-1个，使用数组保存哈夫曼树上所的结点需要 2n-1个存储空间。其算法思路和前文使用队列的思路差不多。直接上代码：

#include <iostream>
using namespace std;
//叶结点数量
const unsigned int n=8;
//一维数组长度
const unsigned int m= 2*n -1;
//树结点
struct TreeNode {
	//权值
	float weight;
	//父结点
	int parent;
	//左结点
	int leftChild;
	//右结点
	int rightChild;
};
class HuffmanTree {
	public:
		//创建一维数组
		TreeNode hfmNodes[m+1];
	public:
		//构造函数
		HuffmanTree(int weights[8]);
		~HuffmanTree( ) {

		}
		void findMinNode(int k, int &s1, int &s2);
		void showInfo() {
			for(int i=0; i<m; i++) {
				cout<<hfmNodes[i].weight<<endl;
			}
		}
};
HuffmanTree::HuffmanTree(int weights[8]) {
	//前2 个权值最小的结点
	int firstMin;
	int  secondMin;
	//初始化数组中的结点
	for(int i = 1; i <= m; i++) {
		hfmNodes[i].weight = 0;
		hfmNodes[i].parent = -1;
		hfmNodes[i].leftChild = -1;
		hfmNodes[i].rightChild = -1;
	}
	//前 n 个是叶结点
	for(int i = 1; i <= n; i++)
		hfmNodes[i].weight=weights[i-1];

	for(int i = n + 1; i <=m; i++) {
		this->findMinNode(i-1, firstMin, secondMin);
		hfmNodes[firstMin].parent = i;
		hfmNodes[secondMin].parent = i;
		hfmNodes[i].leftChild = firstMin;
		hfmNodes[i].rightChild = secondMin;
		hfmNodes[i].weight = hfmNodes[firstMin].weight + hfmNodes[secondMin].weight;
	}
}
void HuffmanTree::findMinNode(int k, int & firstMin, int & secondMin) {
	hfmNodes[0].weight = 32767;
	firstMin=secondMin=0;
	for(int i=1; i<=k; i++) {
		if(hfmNodes[i].weight!=0 && hfmNodes[i].parent==-1) {
			if(hfmNodes[i].weight < hfmNodes[firstMin].weight) { 
                  //如果有比第一小还要小的，则原来的第一小变成第二小
				secondMin = firstMin;
                  //新的第一小
				firstMin = i;
			} else if(hfmNodes[i].weight < hfmNodes[secondMin].weight)
			    //如果仅比第二小的小	
                 secondMin = i;
		}
	}
}

int main() {
	int weights[8]= {3,6,12,9,4,8,21,22};
	HuffmanTree huffmanTree(weights);
	huffmanTree.showInfo();
	return 1;
}

测试结果：

漫谈C++哈夫曼树的原理及实现

目录

4.>

5.>
哈夫曼树是二叉树的应用之一，掌握哈夫曼树的建立和编码方法对解决实际问题有很大帮助。

以上就是漫谈C++哈夫曼树的原理及实现的详细内容，更多关于C++哈夫曼树的资料请关注易采站长站其它相关文章！

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码

漫谈C++哈夫曼树的原理及实现

目录

4.>

5.> 哈夫曼树是二叉树的应用之一，掌握哈夫曼树的建立和编码方法对解决实际问题有很大帮助。 以上就是漫谈C++哈夫曼树的原理及实现的详细内容，更多关于C++哈夫曼树的资料请关注易采站长站其它相关文章！

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码

C++动态规划中关于背包问题讲解

C++回溯算法中组合的相关问题分析

C++回溯算法中子集问题分析探讨

详解C/C++如何获取路径下所有文件及其子目录的文件名

基于C++编写一个简单的服务器

详解C/C++如何获取路径下所有文件及其子目录的文件名

C++实现文件逐行读取与字符匹配的示例详解

VS Code 中安装运行、编写C语言程序的详细教程

C++预处理连接的示例详解

C++实现将数据写入Excel工作表的示例代码

5.>
哈夫曼树是二叉树的应用之一，掌握哈夫曼树的建立和编码方法对解决实际问题有很大帮助。

以上就是漫谈C++哈夫曼树的原理及实现的详细内容，更多关于C++哈夫曼树的资料请关注易采站长站其它相关文章！