Java数据结构之树

树 - 基础和Overview

预备知识

数据结构中的树存储结构

树结构是一种非线性存储结构，存储的是具有“一对多”关系的数据元素的集合。

树结构	线性结构
根结点：无双亲，唯一	第一个数据元素：无前驱元素
叶结点：无孩子，可以多个	最后一个元素：无后继元素
中间结点：一个双亲多个孩子	中间元素：一个前驱元素一个后继元素

存储普通树的方法

大概分为三种：

双亲表示法
孩子表示法
孩子兄弟表示法（孩子兄弟表示法可以作为将普通树转化为二叉树的最有效方法，通常又被称为"二叉树表示法"或"二叉链表表示法"）

这里就先不给代码了，参考资料：树的双亲表示法（C语言实现详解版）

二叉树

什么是二叉树，二叉树及其性质详解

接下来我们来学习一下一类具体的树结构：二叉树。

满足以下两个条件的树就是二叉树：

本身是有序树
树中包含的各个节点的度不能超过 2，即只能是 0、1 或者 2

二叉树性质

二叉树性质如下：

二叉树中，第 i 层最多有 2^(i-1) 个结点（很好理解，2的i-1次方嘛）
如果二叉树的深度为 K，那么此二叉树最多有 2^K-1 个结点（等比数列之和即可求出）
二叉树中，终端结点数（叶子结点数）为 n0，度为 2 的结点数为 n2，则 n0=n2+1

性质 3 的计算方法为：对于一个二叉树来说，除了度为 0 的叶子结点和度为 2 的结点，剩下的就是度为 1 的结点（设为 n1），那么总结点 n=n0+n1+n2。
同时，对于每一个结点来说都是由其父结点分支表示的，假设树中分枝数为 B，那么总结点数 n=B+1。而分枝数是可以通过 n1 和 n2 表示的，即 B=n1+2n2。所以，n 用另外一种方式表示为 n=n1+2n2+1。
两种方式得到的 n 值组成一个方程组，就可以得出 n0=n2+1。

二叉树分类

二叉树又可以分为满二叉树和完全二叉树。也有一种特殊的二叉树叫做二叉查找树。

满二叉树

如果二叉树中除了叶子结点，每个结点的度都为 2，则此二叉树称为满二叉树。

满二叉树除了满足普通二叉树的性质，还具有以下性质：

满二叉树中第 i 层的节点数为 2^(n-1)个（2的i-1次方）
深度为 k 的满二叉树必有 2^k-1 个节点，叶子数为 2^k-1（等比数列前n项和）
满二叉树中不存在度为 1 的节点，每一个分支点中都两棵深度相同的子树，且叶子节点都在最底层
具有 n 个节点的满二叉树的深度为㏒₂n+1

完全二叉树

如果二叉树中除去最后一层节点为满二叉树，且最后一层的结点依次从左到右分布，则此二叉树被称为完全二叉树。

（如图所示，a是一棵完全二叉树，而b由于最后一层的节点没有按照从左向右分布，因此只能算作是普通的二叉树）

完全二叉树除了具有普通二叉树的性质，它自身也具有一些独特的性质，比如说，n 个结点的完全二叉树的深度为 ⌊㏒₂n⌋+1。

⌊㏒₂n⌋ 表示取小于㏒₂n 的最大整数。例如，⌊log24⌋ = 2，而 ⌊log25⌋ 结果也是 2。

对于任意一个完全二叉树来说，如果将含有的结点按照层次从左到右依次标号（如图 3a)），对于任意一个结点 i ，完全二叉树还有以下几个结论成立：

当 i>1 时，父亲结点为结点 [i/2] 。（i=1 时，表示的是根结点，无父亲结点）
如果 2i>n（总结点的个数），则结点 i 肯定没有左孩子（为叶子结点）；否则其左孩子是结点 2i
如果 2i+1>n ，则结点 i 肯定没有右孩子；否则右孩子是结点 2i+1

二叉查找树

二叉查找树（BST：Binary Search Tree）是一种特殊的二叉树，它改善了二叉树节点查找的效率。二叉查找树有以下性质，对于任意一个节点 node：

其左子树（left subtree）下的每个后代节点（descendant node）的值都小于节点 n 的值
其右子树（right subtree）下的每个后代节点的值都大于节点 n 的值

简言之，就是左<中<右。

下图中，a为普通二叉树，b是二叉查找树。

二叉树的遍历

二叉树先序遍历（递归与非递归）及C语言实现

二叉树的层次遍历

二叉树的遍历主要分三种：

先序遍历
中序遍历
后序遍历

第四种也有二叉树的层次遍历。

二叉树遍历的代码实现我们会在下面的二叉树实现中给出，这里先介绍一下这四种遍历。

先序遍历

二叉树先序遍历的实现思想是：

访问根节点
访问当前节点的左子树
若当前节点无左子树，则访问当前节点的右子树

以图 1 为例，采用先序遍历的思想遍历该二叉树的过程为：

访问该二叉树的根节点，找到 1

访问节点 1 的左子树，找到节点 2

访问节点 2 的左子树，找到节点 4

由于访问节点 4 左子树失败，且也没有右子树，因此以节点 4 为根节点的子树遍历完成。但节点 2 还没有遍历其右子树，因此现在开始遍历，即访问节点 5

由于节点 5 无左右子树，因此节点 5 遍历完成，并且由此以节点 2 为根节点的子树也遍历完成。现在回到节点 1 ，并开始遍历该节点的右子树，即访问节点 3

访问节点 3 左子树，找到节点 6

由于节点 6 无左右子树，因此节点 6 遍历完成，回到节点 3 并遍历其右子树，找到节点 7；

节点 7 无左右子树，因此以节点 3 为根节点的子树遍历完成，同时回归节点 1。由于节点 1 的左右子树全部遍历完成，因此整个二叉树遍历完成

因此，该二叉树的先序遍历结果为：1,2,4,5,3,6,7

中序遍历

二叉树中序遍历的实现思想是，从根节点出发：

访问当前节点的左子树
访问根节点
访问当前节点的右子树

以图 1 为例，采用中序遍历的思想遍历该二叉树的过程为：

访问该二叉树的根节点，找到 1

遍历节点 1 的左子树，找到节点 2

遍历节点 2 的左子树，找到节点 4

由于节点 4 无左孩子，因此找到节点 4，并遍历节点 4 的右子树

由于节点 4 无右子树，因此节点 2 的左子树遍历完成，输出节点4，访问节点 2，输出节点2

遍历节点 2 的右子树，找到节点5，输出节点5

由于节点 5 无左子树，因此访问节点 5 ，又因为节点 5 没有右子树，因此节点 1 的左子树遍历完成，访问节点 1 ，输出节点1，并遍历节点 1 的右子树，找到节点 3；

遍历节点 3 的左子树，找到节点 6

由于节点 6 无左子树，因此访问节点 6，输出节点6，又因为该节点无右子树，因此节点 3 的左子树遍历完成，开始访问节点 3 ，输出节点3，并遍历节点 3 的右子树，找到节点 7

由于节点 7 无左子树，因此访问节点 7，输出节点7，又因为该节点无右子树，因此节点 1 的右子树遍历完成，即整棵树遍历完成

因此，该二叉树的中序遍历结果为：4,2,5,1,6,3,7

后序遍历

二叉树后序遍历的实现思想是：从根节点出发：

访问当前节点的左子树
访问当前节点的右子树
访问根节点

（从根节点出发，依次遍历各节点的左右子树，直到当前节点左右子树遍历完成后，才访问该节点元素）

如图 1 中，对此二叉树进行后序遍历的操作过程为：

从根节点 1 开始，遍历该节点的左子树（以节点 2 为根节点）

遍历节点 2 的左子树（以节点 4 为根节点）

由于节点 4 既没有左子树，也没有右子树，此时访问该节点中的元素 4，并回退到节点 2 ，遍历节点 2 的右子树（以 5 为根节点）

由于节点 5 无左右子树，因此可以访问节点 5 ，并且此时节点 2 的左右子树也遍历完成，因此也可以访问节点 2

此时回退到节点 1 ，开始遍历节点 1 的右子树（以节点 3 为根节点）

遍历节点 3 的左子树（以节点 6 为根节点）

由于节点 6 无左右树，因此访问节点 6，并回退到节点 3，开始遍历节点 3 的右子树（以节点 7 为根节点）

由于节点 7 无左右子树，因此访问节点 7，并且节点 3 的左右子树也遍历完成，可以访问节点 3；节点 1 的左右子树也遍历完成，可以访问节点 1

到此，整棵树的遍历结束

因此，该二叉树的后序遍历结果为：4,5,2,6,7,3,1

层次遍历

如下图所示为二叉树的层次遍历，即按照箭头所指方向，按照1、2、3、4的层次顺序，对二叉树中各个结点进行访问(此图反映的是自左至右的层次遍历，自右至左的方式类似)。

二叉树层次遍历的实现逻辑：要建立一个队列。先将二叉树头结点入队列，然后出队列，访问该结点，如果它有左子树，则将左子树的根结点入队：如果它有右子树，则将右子树的根结点入队。然后出队列，对出队结点访问，如此反复，直到队列为空为止。（其实也可以用栈来实现，画一下图逻辑就能理解了）

代码我们写在下面的二叉树实现中。

二叉树的实现

Java数据结构与算法——二叉树及操作(包括二叉树遍历)

二叉树的层次遍历

二叉树的存储结构有两种：顺序存储和链式存储：

二叉树的顺序存储，指的是使用顺序表（数组）存储二叉树。需要注意的是，顺序存储只适用于完全二叉树。换句话说，只有完全二叉树才可以使用顺序表存储。因此，如果我们想顺序存储普通二叉树，需要提前将普通二叉树转化为完全二叉树（注意满二叉树也是完全二叉树）
二叉树的链式存储结构更适合用来存储二叉树。二叉树并不适合用数组存储，因为并不是每个二叉树都是完全二叉树，普通二叉树使用顺序表存储或多或多会存在空间浪费的现象

我们使用链式存储结构来实现二叉树。在之前的学习中我们已经谁了节点类Node的使用。在这里我们也要创建一个节点类BinaryTreeNode，它的属性有：

节点存储的数据（data）
指向左孩子节点的指针（leftChild）
指向右孩子节点的指针（rightChild）

像我们这种，在一个节点中存储了两个个指针域的链表结构，通常称为二叉链表。有的二叉树实现使用三叉链表实现：即除了存储指向左孩子节点的指针（leftChild）和指向右孩子节点的指针（rightChild），还有存储指向父节点的指针（parentChild）。在解决实际问题时，用合适的链表结构存储二叉树，可以起到事半功倍的效果。

二叉树结点

首先我们要先创建一个二叉树结点类BinaryTreeNode，代码如下：

/**
 * 二叉树结点类
 */
public class BinaryTreeNode {
    private int data;   /* 结点数据 */
    private BinaryTreeNode leftChild;   /* 指向左孩子的指针 */
    private BinaryTreeNode rightChild;  /* 指向右孩子的指针 */
    
    public BinaryTreeNode() {
    }
    public BinaryTreeNode(int data) {
        this.data = data;
    }

    public int getData() {
        return data;
    }
    public void setData(int data) {
        this.data = data;
    }

    public BinaryTreeNode getLeftChild() {
        return leftChild;
    }
    public void setLeftChild(BinaryTreeNode leftChild) {
        this.leftChild = leftChild;
    }

    public BinaryTreeNode getRightChild() {
        return rightChild;
    }
    public void setRightChild(BinaryTreeNode rightChild) {
        this.rightChild = rightChild;
    }
    
    @Override
    public String toString() {
        return "BinaryTreeNode{" +
                "data=" + data +
                '}';
    }
}

二叉树

然后创建二叉树类BinaryTree，代码如下：

/**
 * 二叉树的实现
 */
public class BinaryTree {
    private BinaryTreeNode root;    // 二叉树的根节点

    /**
     * 二叉树构造方法
     */
    public BinaryTree() {
    }
    public BinaryTree(BinaryTreeNode root) {
        this.root = root;
    }

    public BinaryTreeNode getRoot() {
        return root;
    }
    public void setRoot(BinaryTreeNode root) {
        this.root = root;
    }

    /**
     * 清空整个二叉树
     * 直接通过上一种方法删除到根节点即可
     */
    public void clear(){
        clear(root);
    }
    /**
     * 清空二叉树中以node为节点下的子树
     * 清空以某个节点为根节点的子树的方法，即递归地删除每个节点
     * @param node 给定node节点
     */
    public void clear(BinaryTreeNode node){
        if (node!=null){
            clear(node.getLeftChild());
            clear(node.getRightChild());
            node = null;    // 删除该节点
        }
    }

    /**
     * 判断二叉树是否为空
     * @return 二叉树为空返回true
     */
    public boolean isEmpty(){
        return root==null;
    }

    /**
     * 求整个二叉树的高度
     * @return
     */
    public int height(){
        return height(root);
    }
    /**
     * 获取以node节点为子树的高度，通过递归实现：
     * 如果一个节点为空，那么这个节点肯定是一颗空树，高度为0；
     * 如果不为空，则遍历地比较它的左右子树高度，高的一个为这颗子树的最大高度，然后加上自身的高度即可
     * @param node
     * @return
     */
    public int height(BinaryTreeNode node){
        if (node==null){    // 递归出口，空子树高度为0
            return 0;
        }else { // 这里的递归逻辑打一下草稿就能搞懂
            int leftHeight = height(node.getLeftChild());   // 递归获取左子树高度
            int rightHeight = height(node.getRightChild());   // 递归获取右子树高度
            // 注意这里要取左右子树的最大值，最后别忘了加1（加上node节点本身）
            return Math.max(leftHeight, rightHeight)+1;
        }
    }

    /**
     * 求整个二叉树的结点数
     * @return
     */
    public int size(){
        return size(root);
    }
    /**
     * 获取以node节点为根的子树的节点数，通过递归实现：
     * 如果节点为空，则个数肯定为0；
     * 如果不为空，则算上这个节点之后，继续递归计算所有子树的节点数，全部相加即可
     * @param node
     * @return
     */
    public int size(BinaryTreeNode node){
        if (node==null){    // 递归出口，如果如果节点为空，则返回节点数为0
            return 0;
        }else { // 这里的递归逻辑打一下草稿就能搞懂
            /* 递归获取左子树节点数和右子树节点数，最终相加
            *  最后别忘了+1，因为要加上node节点本身 */
            return 1+size(node.getLeftChild())+size(node.getRightChild());
        }
    }

    /**
     * 获取node节点的父节点
     * @param node
     * @return
     */
    public BinaryTreeNode getParent(BinaryTreeNode node){
        if (root==null){
            return null;
        }else {
            return getParent(root,node);
        }
    }
    /**
     * 获取node节点在subTree子树中的父节点 ，通过递归实现：
     * @param subTree subTree子树即为以subTree节点为根节点的子树
     * @param node
     * @return
     */
    public BinaryTreeNode getParent(BinaryTreeNode subTree,BinaryTreeNode node){
        /* 以下两个递归出口 */
        if (subTree==null){ // 如果是空子树，则没有父节点
            return null;
        }
        // 如果子树的根节点的左右孩子之一是待查节点node，则返回子树的根节点subTree
        if (subTree.getLeftChild()==node||subTree.getRightChild()==node){
            return subTree;
        }
        // 开始递归左右子树（这里的递归有点复杂，但是稿纸上写个例子还是能搞懂的）
        // 这里我们的二叉链表实现起来比较难，但是三叉链表就非常简单了
        if (getParent(subTree.getLeftChild(),node)!=null) { // 注意这里判断条件中的写法
            return getParent(subTree.getLeftChild(), node);
        }else {
            return getParent(subTree.getRightChild(),node);
        }
    }

    /**
     * 返回node节点的左孩子节点
     * @param node
     * @return
     */
    public BinaryTreeNode getLeft(BinaryTreeNode node){
        return node.getLeftChild();
    }
    /**
     * 返回node节点的右孩子节点
     * @param node
     * @return
     */
    public BinaryTreeNode getRight(BinaryTreeNode node){
        return node.getRightChild();
    }

    /**
     * 给parent节点插入左节点newNode
     * @param parent
     * @param newNode
     */
    public void insertLeft(BinaryTreeNode parent,BinaryTreeNode newNode){
        parent.setLeftChild(newNode);
    }

    /**
     * 给parent节点插入右节点newNode
     * @param parent
     * @param newNode
     */
    public void insertRight(BinaryTreeNode parent,BinaryTreeNode newNode){
        parent.setRightChild(newNode);
    }
}

二叉树的四种遍历

关于二叉树遍历的四种实现，我们专门在下面列出。代码如下：

/**
 * 先序遍历
 * 从根节点开始面对整个二叉树进行先序遍历
 */
public void preOrder(){
    preOrder(root);
}
/**
 * 先序遍历
 * 从node节点开始，对二叉树进行先序遍历
 * @param node (以node节点为根节点进行先序遍历)
 */
public void preOrder(BinaryTreeNode node){
    if (node!=null){   // 递归出口
        System.out.print(node);        // 遍历根节点
        preOrder(node.getLeftChild());   // 先序遍历左子树
        preOrder(node.getRightChild());  // 先序遍历右子树
    }
}

/**
 * 中序遍历
 * 从根节点开始面对整个二叉树进行中序遍历
 */
public void inOrder(){
    inOrder(root);
}
/**
 * 中序遍历
 * 从node节点开始，对二叉树进行中序遍历
 * @param node (以node节点为根节点进行中序遍历)
 */
public void inOrder(BinaryTreeNode node){
    if (node!=null){   // 递归出口
        inOrder(node.getLeftChild());   // 中序遍历左子树
        System.out.print(node);        // 遍历根节点
        inOrder(node.getRightChild());  // 中序遍历右子树
    }
}

/**
 * 后序遍历
 * 从根节点开始面对整个二叉树进行后序遍历
 */
public void postOrder(){
    postOrder(root);
}
/**
 * 后序遍历
 * 从node节点开始，对二叉树进行后序遍历
 * @param node (以node节点为根节点进行后序遍历)
 */
public void postOrder(BinaryTreeNode node){
    if (node!=null){   // 递归出口
        postOrder(node.getLeftChild());   // 后序遍历左子树
        postOrder(node.getRightChild());  // 后序遍历右子树
        System.out.print(node);        // 遍历根节点
    }
}

/**
 * 层次遍历
 * 从根节点开始面对整个二叉树进行层次遍历
 */
public void levelOrder(){
    levelOrder(root);
}
/**
 * 层次遍历
 * 从node节点开始，对二叉树进行层次遍历
 * @param node (以node节点为根节点进行层次遍历)
 */
public void levelOrder(BinaryTreeNode node){
    // 用LinkedList来实现队列
    LinkedList<BinaryTreeNode> linkedList = new LinkedList<>();
    linkedList.add(node);   // 先将node节点入队列
    while (!linkedList.isEmpty()){  // 只要队列不为空就要一直遍历下去
        BinaryTreeNode poll = linkedList.poll();    // 出队列
        System.out.print(poll);   // 遍历到该结点了
        if (poll.getLeftChild()!=null){ // 有左子树，则将左子树的根结点入队
            linkedList.add(poll.getLeftChild());
        }
        if (poll.getRightChild()!=null){ // 有右子树，则将右子树的根结点入队
            linkedList.add(poll.getRightChild());
        }
    }
}

二叉搜索树(BST)

平衡二叉树(AVL)

详解 AVL 树（基础篇）

什么是平衡二叉树（AVL）

红黑树(R-B Tree)

哈夫曼树(Huffman Tree)

哈夫曼树，也叫最优二叉树。

哈夫曼树（赫夫曼树、最优树）及C语言实现

树 - 哈夫曼树(Huffman Tree)

构建哈夫曼树

对于给定的有各自权值的 n 个结点，构建哈夫曼树有一个行之有效的办法：

在 n 个权值中选出两个最小的权值，对应的两个结点组成一个新的二叉树，且新二叉树的根结点的权值为左右孩子权值的和；
在原有的 n 个权值中删除那两个最小的权值，同时将新的权值加入到 n–2 个权值的行列中，以此类推；
重复 1 和 2 ，直到所以的结点构建成了一棵二叉树为止，这棵树就是哈夫曼树。

图 2 中，（A）给定了四个结点a，b，c，d，权值分别为7，5，2，4；第一步如（B）所示，找出现有权值中最小的两个，2 和 4 ，相应的结点 c 和 d 构建一个新的二叉树，树根的权值为 2 + 4 = 6，同时将原有权值中的 2 和 4 删掉，将新的权值 6 加入；进入（C），重复之前的步骤。直到（D）中，所有的结点构建成了一个全新的二叉树，这就是哈夫曼树。

哈夫曼编码

哈夫曼编码就是在哈夫曼树的基础上构建的，这种编码方式最大的优点就是用最少的字符包含最多的信息内容。

根据发送信息的内容，通过统计文本中相同字符的个数作为每个字符的权值，建立哈夫曼树。对于树中的每一个子树，统一规定其左孩子标记为 0 ，右孩子标记为 1 。这样，用到哪个字符时，从哈夫曼树的根结点开始，依次写出经过结点的标记，最终得到的就是该结点的哈夫曼编码。

文本中字符出现的次数越多，权值越大，在哈夫曼树中的体现就是越接近树根。编码的长度越短。

如图 3 所示，字符 a 用到的次数最多，其次是字符 b 。字符 a 在哈夫曼编码是 0 ，字符 b 编码为 10 ，字符 c 的编码为 110 ，字符 d 的编码为 111 。

哈夫曼树的实现

构建哈夫曼树时，首先需要确定树中结点的构成。由于哈夫曼树的构建是从叶子结点开始，不断地构建新的父结点，直至树根，所以结点中应包含指向父结点的指针。但是在使用哈夫曼树时是从树根开始，根据需求遍历树中的结点，因此每个结点需要有指向其左孩子和右孩子的指针。（即使用三叉链表）

这里在实现二叉树时，用到了最小堆（又叫小根堆）。（其实可以使用Java中的优先队列 PriorityQueue来实现，不需要自己再写一个最小堆，但是这里我们顺带学习一下最小堆就手写了一个）

和实现二叉树一样，在实现哈夫曼树之前我们先来看看哈夫曼树结点类：

key：结点的权值
left：结点的左孩子
right：结点的右孩子
parent：结点的父结点

哈夫曼树结点

首先创建哈夫曼树结点类HuffmanNode，代码如下：

/**
 * 哈夫曼树结点类
 */
public class HuffmanNode implements Comparable,Cloneable  {
    // 避免大量的使用Get和Set方法(看起来比较麻烦)，这里就用protected修饰
    protected int key;              // 权值
    protected HuffmanNode left;     // 左孩子
    protected HuffmanNode right;    // 右孩子
    protected HuffmanNode parent;   // 父结点

    /**
     * 构造方法
     * @param key
     * @param left
     * @param right
     * @param parent
     */
    public HuffmanNode(int key, HuffmanNode left, HuffmanNode right, HuffmanNode parent) {
        this.key = key;
        this.left = left;
        this.right = right;
        this.parent = parent;
    }

    /**
     * 重写clone方法，返回一个克隆的哈夫曼树结点
     * @return
     */
    @Override
    protected Object clone(){
        Object object = null;
        try {
            object = (HuffmanNode)super.clone();    // Object中的clone(),识别出你要复制的是哪一个对象。
        } catch (CloneNotSupportedException e) {
            e.printStackTrace();
        }
        return object;
    }

    /**
     * 重写compareTo方法，根据key值升序排序
     * @param o
     * @return
     */
    @Override
    public int compareTo(Object o) {
        return this.key - ((HuffmanNode)o).key;
    }
}

哈夫曼树

然后创建HuffmanTree类，代码如下：

import java.util.ArrayDeque;

/**
 * 哈夫曼树
 */
public class HuffmanTree {
    private HuffmanNode root;   // 根节点

    /**
     * 构造方法（根据结点key值数组来创建哈夫曼树）
     * 根据哈夫曼树的特性，构造中需要用到优先队列
     * @param arr 存储各个结点key值的数组
     */
    public HuffmanTree(int arr[]) {
        HuffmanNode parent = null;
        // 根据数组arr建立最小堆
        MinHeap minHeap = new MinHeap(arr);
        for (int i = 0; i < arr.length-1; i++) {
            // dumpFromMinimum操作其实就是类似从升序优先队列中poll出一个值
            HuffmanNode left = minHeap.dumpFromMinimum();   // 左节点比右节点要小
            HuffmanNode right = minHeap.dumpFromMinimum();   // 左节点比右节点要小
            // 最小的两个节点确定后，将它们的父结点插入到小根堆中
            parent = new HuffmanNode(left.key + right.key, left, right, null);
            minHeap.insert(parent);
        }
        // 循环结束后，最后的parent节点即为哈夫曼树的根节点
        root = parent;
        // 哈夫曼树构造完毕理内存，销毁最小堆
        minHeap.destroy();
    }

    // 前序遍历、中序遍历、后序遍历以及层次遍历跟二叉树的实现一样，这里不再多说
    /**
     * 先序遍历
     */
    public void preOrder(){
        preOrder(root);
    }
    private void preOrder(HuffmanNode node){
        if (node!=null){    // 递归出口node为null
            System.out.print(node.key+" ");
            preOrder(node.left);
            preOrder(node.right);
        }
    }

    /**
     * 中序遍历
     */
    public void inOrder(){
        inOrder(root);
    }
    private void inOrder(HuffmanNode node) {
        if (node!=null){    // 递归出口node为null
            inOrder(node.left);
            System.out.print(node.key+" ");
            inOrder(node.right);
        }
    }

    /**
     * 后序遍历
     */
    public void postOrder(){
        postOrder(root);
    }
    private void postOrder(HuffmanNode node){
        if (node!=null){    // 递归出口node为null
            postOrder(node.left);
            postOrder(node.right);
            System.out.print(node.key+" ");
        }
    }

    /**
     * 层次遍历
     */
    public void levelOrder(){
        levelOrder(root);
    }
    private void levelOrder(HuffmanNode node) {
        ArrayDeque<HuffmanNode> deque = new ArrayDeque<>();     // 用队列来实现层次遍历
        deque.add(node);    // 先将add节点入队列
        while (!deque.isEmpty()){   // 主要队列不为空就要一直遍历下去
            HuffmanNode remove = deque.remove();
            System.out.print(remove.key+" ");   // 遍历到该结点了
            if (remove.left!=null){ // 该节点有左孩子，入队
                deque.add(remove.left);
            }
            if (remove.right!=null){ // 该节点有右孩子，入队
                deque.add(remove.right);
            }
        }
    }

    /**
     * 打印哈夫曼树
     */
    public void print(){
        if (root!=null){
            print(root,root.key,0);
        }
    }
    /**
     * 打印哈夫曼树
     * @param node 当前结点
     * @param key 结点的键值
     * @param direction 对node结点的描述：
     *                  0，表示该节点是根节点;
     *                  -1，表示该节点是它的父结点的左孩子;
     *                  1，表示该节点是它的父结点的右孩子。
     */
    private void print(HuffmanNode node, int key, int direction) {
        if (node!=null){
            if (direction==0){  // node是根结点
                System.out.printf("%2d is root\n", node.key);
            }else { // 根据node是左孩子还是右孩子来输出
                System.out.printf("%2d is %2d's %6s child\n", node.key, key, direction==1?"right" : "left");
            }
            print(node.left,node.key,-1);
            print(node.right,node.key,1);
        }
    }
}

这里关键的其实就是哈夫曼树的创建过程。根据哈夫曼树的特性很容易想到用升序优先队列（最小堆或者叫小根堆）来实现。

以数组{5,6,8,7,15}为例，哈夫曼树的构造过程如下：

最小堆（升序优先队列）

其中最小堆其实可以用Java自带的优先队列来实现，这里我们敲一下代码体会下如何实现优先队列。代码如下：

import java.util.ArrayList;
import java.util.List;

/**
 * 最小堆
 */
public class MinHeap {
    private List<HuffmanNode> heap; // 存放堆的数组

    /**
     * 构造方法，根据给定数组创建最小堆
     * @param arr 数据所在数组
     */
    public MinHeap(int arr[]) {
        heap = new ArrayList<HuffmanNode>();
        // 初始化数组
        for (int i = 0; i < arr.length; i++) {
            HuffmanNode huffmanNode = new HuffmanNode(arr[i], null, null, null);
            heap.add(huffmanNode);
        }
        // 从(size/2-1)到0逐次遍历。遍历之后，得到的数组实际上是一个最小堆。
        for (int i = arr.length / 2 - 1; i >= 0; i--){
            filterdown(i, arr.length-1);
        }
    }

    /**
     * 最小堆的向下调整算法
     * 注：数组实现的堆中，第N个结点的左孩子索引是(2N+1)，右孩子的索引是(2N+2)
     * @param start 被下调节点的起始位置(一般为0，表示从第1个开始)
     * @param end 截至范围(一般为数组中最后一个元素的索引)
     */
    protected void filterdown(int start, int end) {
        int current = start;  // 当前结点的位置
        int left = 2*current+1; // 当前结点的左孩子的位置
        HuffmanNode temp = heap.get(current);   // 当前结点
        // 上面已经说过，left为左孩子位置，那么右孩子位置即为left+1
        while (left<=end){
            if (left<end && (heap.get(left).compareTo(heap.get(left+1))>0)){
                left++; // 左右两孩子中选择较小者，即heap[left+1]
            }
            int cmp = temp.compareTo(heap.get(left));
            if (cmp<=0){    // 调整结束
                break;
            }else {
                heap.set(current, heap.get(left));
                current = left;
                left = 2*left+1;
            }
        }
        heap.set(current,temp);
    }

    /**
     * 最小堆的向上调整法（从start开始向上到0，调整堆）
     * 注：数组实现的堆中，第N个节点的左孩子的索引值是(2N+1)，右孩子的索引是(2N+2)。
     * @param start 从start开始向上到0，调整堆
     */
    protected void filterup(int start) {
        int current = start;    // 当前结点位置
        int parent = (current - 1) / 2; // 当前结点的父结点位置
        HuffmanNode temp = heap.get(current);   // 当前结点
        while (current>0){
            int cmp = heap.get(parent).compareTo(temp);
            if (cmp<=0){    // parent结点不大于temp结点
                break;
            }else {
                heap.set(current, heap.get(parent));
                current = parent;
                parent = (parent-1)/2;
            }
            heap.set(current,temp);
        }
    }

    /**
     * 将结点插入到二叉堆中
     * @param node 要插入的哈夫曼树结点
     */
    protected void insert(HuffmanNode node){
        int size = heap.size();
        heap.add(node);     // 将"数组"插在表尾
        filterup(size);     // 向上调整堆
    }

    /**
     * 交换i位置和j位置这两个结点的全部数据
     * @param i
     * @param j
     */
    private void swapNode(int i,int j){
        HuffmanNode temp = heap.get(i);
        heap.set(i, heap.get(j));
        heap.set(j,temp);
    }

    /**
     * poll出最小堆中的最小元素（类似于优先队列的出队操作）
     * 新建一个节点，并将最小堆中最小节点的数据复制给该节点,然后除最小节点之外的数据重新构造成最小堆。
     * @return 返回原最小堆中最小的结点。若失败则返回null
     */
    protected HuffmanNode dumpFromMinimum(){
        int size = heap.size();
        // 如果"堆"已空，则返回
        if(size == 0)
            return null;
        // 将"最小结点"克隆一份，将克隆得到的对象赋值给node
        HuffmanNode node = (HuffmanNode)heap.get(0).clone();
        // 交换"最小结点"和"最后一个结点"
        heap.set(0, heap.get(size-1));
        // 删除最后的元素（交换后，即删除了最小结点）
        heap.remove(size-1);
        if (heap.size() > 1){
            // 向下调整堆，使第0个元素为最小元素，保证新的堆依然是最小堆
            filterdown(0, heap.size()-1);
        }
        return node;
    }

    /**
     * 销毁最小堆
     */
    protected void destroy(){
        heap.clear();
        heap = null;
    }
}

前缀树(Tire Tree)

伸展树

B树

标准库中的集合与映射

在之前的笔记中我们讨论过的List容器，即ArrayList和LinkedList用于查找效率很低。因此，Collections API提供了两个附加容器Set和Map，它们对诸如插人、删除和查找等基本操作提供有效的实现。

Java Set集合：HashSet和TreeSet类

Java Map集合详解

【集合系列】- 深入浅出的分析 Set集合

集合知识全系列回顾

可以参考之前写的有道云笔记：Map，Set集合

在 Java 中，集合大致可以分为两大体系，一个是 Collection，另一个是 Map，都位于java.util包下。

Collection ：主要由 List、Set、Queue 接口组成，List 代表有序、重复的集合；其中 Set 代表无序、不可重复的集合；Java 5 又增加了 Queue 体系集合，代表队列集合。

Map：则代表具有映射关系的键值对集合。

java.util.Collection下的接口和继承类关系简易结构图：

java.util.Map下的接口和继承类关系简易结构图：

在 Java 集合框架中，数据结构和算法可以说在里面体现的淋淋尽致，这一点可以从我们之前对各个集合类的分析就可以看的出来，如动态数组、链表、红黑树、Set、Map、队列、栈、堆等，基本上只要出去面试，集合框架的话题一定不会少！

更具体的，可参考我搬运的笔记：Java数据结构之集合知识全系列