在一棵树中,从任意一个结点到达另一个结点的通路被称为路径,该路径上所需经过的边的个数被称为该路径的长度。若树中结点带有表示某种意义的权值,那么从根结点到达该节点的路径长度再乘以该结点权值被称为该结点的带权路径长度。树所有的叶子结点的带权路径长度和为该树的带权路径长度和。给定 n 个结点和它们的权值,以它们为叶子结点构造一棵带权路径和最小的二叉树, 该二叉树即为哈夫曼树,同时也被称为最优树。
给定结点的哈夫曼树可能不唯一,所以关于哈夫曼树的机试题往往需要求解的是其最小带权路径长度和。回顾一下我们所熟知的哈夫曼树求法。
1.将所有结点放入集合 K。
2.若集合 K 中剩余结点大于 2 个,则取出其中权值最小的两个结点,构造他们同时为某个新节点的左右儿子,该新节点是他们共同的双亲结点,设定它的权值为其两个儿子结点的权值和。并将该父亲结点放入集合 K。重复步骤 2 或 3。
3.若集合 K 中仅剩余一个结点,该结点即为构造出的哈夫曼树数的根结点, 所有构造得到的中间结点(即哈夫曼树上非叶子结点)的权值和即为该哈夫曼树的带权路径和。
为了方便快捷高效率的求得集合 K 中权值最小的两个元素,我们需要使用堆数据结构。它可以以 O(logn)的复杂度取得 n 个元素中的最小元素。为了绕过对堆的实现我们使用标准模板库中的相应的标准模板——优先队列。
:有4 个结点 a, b, c, d,权值分别为 7, 5, 2, 4,试构造以此 4 个结点为叶子结点的二叉树。
根据给定的n个权值{w1,w2,…,wn}构成二叉树集合F={T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为wi的根结点,其左右子树为空.
在F中选取两棵根结点权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左右子树根结点的权值之和.
在F中删除这两棵树,同时将新的二叉树加入F中.
重复,直到F只含有一棵树为止.(得到哈夫曼树)
利用语句
priority_queue Q;
建立一个保存元素为 int 的堆 Q,但是请特别注意这样建立的堆其默认为大顶堆,即我们从堆顶取得的元素为整个堆中最大的元素。而在求哈夫曼树中,我们恰恰需要取得堆中最小的元素,于是我们使用如下语句定义一个小顶堆: (关于这一点见补充)
priority_queue