数据结构与算法（九）Set集合和BinarySearchTree的时间复杂度分析

编程入门行业动态更新时间:2024-10-23 09:39:29

数据结构与算法（九）Set集合和BinarySearchTree的时间<a href=https://www.elefans.com/category/jswz/34/1767520.html style= 复杂度分析"/>

数据结构与算法（九）Set集合和BinarySearchTree的时间复杂度分析

本文主要包括以下内容：

Set集合的基本概念
Set集合的基本操作
Set集合的BST实现和LinkedList实现
Set集合两种实现方式的时间复杂度分析

Set集合的基本概念

Set集合是对数学中集合的抽象，Set集合有两个特性：

Set集合里没有重复元素
Set集合是无序集合

Set集合的基本操作

插入
删除
Set是否为空
Set是否包含某个元素
Set元素个数

可以将以上几个操作定义一下几个方法

public interface Set<T> {void add(T e);boolean contains(T e);void remove(T e);boolean isEmpty();int size();
}

Set集合的BST实现和链表实现

Set集合底层我们可以使用顺序的线性表、链表、二叉树来实现。下面分别使用二分搜索树和链表来实现下Set集合

二分搜索树实现Set

二分搜索树实现Set使用到了前面介绍的二分搜索树的实现类 BST.java

关于二分搜索树，有需要的可以查看数据结构与算法（八）二分搜索树(Binary Search Tree)

public class BSTSet<T extends Comparable<T>> implements Set<T> {private BST<T> bst;public BSTSet() {bst = new BST<>();}@Overridepublic void add(T e) {bst.add(e);}@Overridepublic boolean contains(T e) {return bst.contains(e);}@Overridepublic void remove(T e) {bst.contains(e);}@Overridepublic boolean isEmpty() {return bst.isEmpty();}@Overridepublic int size() {return bst.size();}
}

链表实现Set

下面链表实现的Set，使用到了以前介绍的链表实现类 LinkedList.java

关于链表的内容，有需要的可以查看数据结构与算法（二）线性表之链式存储和LinkedList

public class LinkedListSet<T> implements Set<T> {private LinkedList<T> linkedList;public LinkedListSet() {linkedList = new LinkedList<>();}@Overridepublic void add(T e) {if (!linkedList.contains(e)) {linkedList.addFirst(e);}}@Overridepublic boolean contains(T e) {return linkedList.contains(e);}@Overridepublic void remove(T e) {linkedList.remove(e);}@Overridepublic boolean isEmpty() {return linkedList.isEmpty();}@Overridepublic int size() {return linkedList.size();}
}

利用Set的特性：不允许元素重复。我们可以使用Set集合来统计下两本英文原著双城记(A Tale of Two Cities)和傲慢与偏见(Pride and Prejudice)的词汇量

Pride and PrejudiceTotal words: 125901Total different words: 6530A Tale of Two CitiesTotal words: 141489Total different words: 9944

从上面的数据可以看出，傲慢与偏见词汇量6530，双城记为9944，。这个统计只是简单的统计，比如单词的时态，单复数等都当做一个新单词。

两种实现方式的时间复杂度分析

我们来对比下基于二分搜索树和链表来实现的Set和的性能差异：

pride-and-prejudice.txtTotal words: 125901Total different words: 6530pride-and-prejudice.txtTotal words: 125901Total different words: 6530BSTSet        Time: 0.121546597
LinkedListSet Time: 2.122136759

根据上面的统计数据可以看出，BSTSet比LinkedListSet快20倍左右。

我们知道链表的插入操作的时间复杂度是O(1)，但是实现Set集合需要先判断集合中是否存在(contains)，所以总的下来插入的操作为O(n)

那么二分搜索树的插入时间复杂度呢？假如我们往以下一个二分搜索树插入元素 7，插入路径如下图所示：

根据插入路径我们知道，插入元素7，只要和8、5、6作比较，不需要和链表一样最坏的情况需要和每个元素进行比较。而这个路径也就是二分搜索树的高度。下面用一个表格来对比二分搜索树实现的Set和链表实现的Set的时间复杂度：