第二十七篇 玩转数据结构——集合(Set)与映射(Map)

1.. 集合的应用

  • 集合可以用来去重
  • 集合可以用于进行客户的统计
  • 集合可以用于文本词汇量的统计

2.. 集合的实现

  • 定义集合的接口
  • Set<E>
    ·void add(E)   // 不能添加重复元素
    ·void remove(E)
    ·boolean contains(E)
    ·int getSize()
    ·boolean isEmpty()
  • 集合接口的业务逻辑如下:
  • public interface Set<E> {
    
        void add(E e);
    
        void remove(E e);
    
        boolean contains(E e);
    
        int getSize();
    
        boolean isEmpty();
    }
  • 用二分搜索树作为集合的底层实现
  • public class BSTSet<E extends Comparable<E>> implements Set<E> {
    
        private BST<E> bst;
    
        // 构造函数
        public BSTSet() {
            bst = new BST<>();
        }
    
        // 实现getSize方法
        @Override
        public int getSize() {
            return bst.size();
        }
    
        // 实现isEmpty方法
        @Override
        public boolean isEmpty() {
            return bst.isEmpty();
        }
    
        // 实现contains方法
        @Override
        public boolean contains(E e) {
            return bst.contains(e);
        }
    
        // 实现add方法
        public void add(E e) {
            bst.add(e);
        }
    
        // 实现remove方法
        public void remove(E e) {
            bst.remove(e);
        }
    }
  • 用链表作为集合的底层实现
  • public class LinkedListSet<E> implements Set<E> {
    
        private LinkedList<E> list;
    
        // 构造函数
        public LinkedListSet() {
            list = new LinkedList<>();
        }
    
        // 实现getSize方法
        @Override
        public int getSize() {
            return list.getSize();
        }
    
        // 实现isEmpty方法
        @Override
        public boolean isEmpty() {
            return list.isEmpty();
        }
    
        // 实现contains方法
        @Override
        public boolean contains(E e) {
            return list.contains(e);
        }
    
        // 实现add方法
        @Override
        public void add(E e) {
            if (!list.contains(e)) {
                list.addFirst(e);
            }
        }
    
        // 实现remove方法
        @Override
        public void remove(E e) {
            list.removeElement(e);
        }
  • 用二分搜索树实现的集合与用链表实现的集合的性能比较
  • import java.util.ArrayList;
    
    public class Main {
    
        public static double testSet(Set<String> set, String filename) {
    
            long startTime = System.nanoTime();
    
            System.out.println(filename);
            ArrayList<String> words = new ArrayList<>();
            if (FileOperation.readFile(filename, words)) {
                System.out.println("Total words: " + words.size());
    
                for (String word : words) {
                    set.add(word);
                }
                System.out.println("Total different words: " + set.getSize());
            }
    
            long endTime = System.nanoTime();
    
            return (endTime - startTime) / 1000000000.0;
        }
    
        public static void main(String[] args) {
            String filename = "pride-and-prejudice.txt";
    
            BSTSet<String> bstSet = new BSTSet<>();
            double time1 = testSet(bstSet, filename);
            System.out.println("BSTSet, time: " + time1 + " s");
    
            System.out.println();
    
            LinkedListSet<String> linkedListSet = new LinkedListSet<>();
            double time2 = testSet(linkedListSet, filename);
            System.out.println("LinkedListSet, time: " + time2 + " s");
        }
    }
  • 输出结果:
  • pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    BSTSet, time: 0.109504342 s
    
    pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    LinkedListSet, time: 2.208894105 s
  • 通过比较结果,我们发现,用二分搜索树实现的集合的比用链表实现的集合更加高效

3.. 集合的时间复杂度分析

  • 上图中"h"是二分搜索树的高度
  • 当二分搜索树"满"的时候,性能是最佳的,时间复杂度为O(logn);当二分搜索树退化为链表的时候,性能是最差的,时间复杂度为O(n)

4.. 映射(Map)

  • 映射是存储(键,值)数据对的数据结构(Key, Value)
  • 根据键(Key),寻找值(Value)

5.. 映射的实现

  • 定义映射的接口
  • Map<K, V>
    ·void add(K, V)
    ·V remove(K)
    ·boolean contains(K)
    ·V get(K)
    ·void set(K, V)
    ·int getSize()
    ·boolean isEmpty()
  • 映射接口的业务逻辑如下
  • public interface Map<K, V> {
    
        void add(K key, V value);
    
        V remove(K key);
    
        boolean contains(K key);
    
        V get(K key);
    
        void set(K key, V value);
    
        int getSize();
    
        boolean isEmpty();
    }
  • 用链表作为映射的底层实现
  • public class LinkedListMap<K, V> implements Map<K, V> {
    
        private class Node {
            public K key;
            public V value;
            public Node next;
    
            public Node(K key, V value, Node next) {
                this.key = key;
                this.value = value;
                this.next = next;
            }
    
            public Node(K key) {
                this(key, null, null);
            }
    
            public Node() {
                this(null, null, null);
            }
    
            @Override
            public String toString() {
                return key.toString() + " : " + value.toString();
            }
        }
    
        private Node dummyHead;
        private int size;
    
        // 构造函数
        public LinkedListMap() {
            dummyHead = new Node();
            size = 0;
        }
    
        // 实现getSize方法
        @Override
        public int getSize() {
            return size;
        }
    
        // 实现isEmpty方法
        @Override
        public boolean isEmpty() {
            return size == 0;
        }
    
        private Node getNode(K key) {
            Node cur = dummyHead;
            while (cur != null) {
                if (cur.key.equals(key)) {
                    return cur;
                }
                cur = cur.next;
            }
            return null;
        }
    
        // 实现contains方法
        @Override
        public boolean contains(K key) {
            return getNode(key) != null;
        }
    
        // 实现get方法
        @Override
        public V get(K key) {
            Node node = getNode(key);
    
            // return node == null ? null : node.value;
            if (node != null) {
                return node.value;
            }
            return null;
        }
    
        // 实现add方法
        public void add(K key, V value) {
            Node node = getNode(key);
            if (node == null) {
                dummyHead.next = new Node(key, value, dummyHead.next);
                size++;
            } else {
                node.value = value;
            }
        }
    
        // 实现set方法
        public void set(K key, V newValue) {
            Node node = getNode(key);
            if (node == null) {
                throw new IllegalArgumentException(key + " doesn‘t exist.");
            } else {
                node.value = newValue;
            }
        }
    
        // 实现remove方法
        public V remove(K key) {
    
            Node node = getNode(key);
            if (node == null) {
                throw new IllegalArgumentException(key + " doesn‘t exist.");
            }
    
            Node prev = dummyHead;
            while (prev.next != null) {
                if (prev.next.key.equals(key)) {
                    break;
                }
                prev = prev.next;
            }
    
            if (prev.next != null) {
                Node delNode = prev.next;
                prev.next = delNode.next;
                delNode.next = null;
                size--;
                return delNode.value;
            }
            return null;
        }
    }
  • 用二分搜索树作为映射的底层实现
  • public class BSTMap<K extends Comparable<K>, V> implements Map<K, V> {
    
        private class Node {
            private K key;
            private V value;
            private Node left;
            private Node right;
    
            // 构造函数
            public Node(K key, V value) {
                this.key = key;
                this.value = value;
                this.left = null;
                this.right = null;
            }
    
    //        public Node(K key) {
    //            this(key, null);
    //        }
        }
    
        private Node root;
        private int size;
    
        // 构造函数
        public BSTMap() {
            root = null;
            size = 0;
        }
    
        // 实现getSize方法
        @Override
        public int getSize() {
            return size;
        }
    
        // 实现isEmpty方法
        public boolean isEmpty() {
            return size == 0;
        }
    
        // 实现add方法
        @Override
        public void add(K key, V value) {
            root = add(root, key, value);
        }
    
        // 向以node为根节点的二分搜索树中插入元素(key, value),递归算法
        // 返回插入新元素后的二分搜索树的根
        private Node add(Node node, K key, V value) {
    
            if (node == null) {
                size++;
                return new Node(key, value);
            }
    
            if (key.compareTo(node.key) < 0) {
                node.left = add(node.left, key, value);
            } else if (key.compareTo(node.key) > 0) {
                node.right = add(node.right, key, value);
            } else {
                node.value = value;
            }
            return node;
        }
    
        // 返回以node为根节点的二分搜索树中,key所在的节点
        private Node getNode(Node node, K key) {
    
            if (node == null)
                return null;
    
            if (key.compareTo(node.key) < 0) {
                return getNode(node.left, key);
            } else if (key.compareTo(node.key) > 0) {
                return getNode(node.right, key);
            } else {
                return node;
            }
        }
    
        @Override
        public boolean contains(K key) {
            return getNode(root, key) != null;
        }
    
        @Override
        public V get(K key) {
    
            Node node = getNode(root, key);
            return node == null ? null : node.value;
        }
    
        @Override
        public void set(K key, V newValue) {
            Node node = getNode(root, key);
            if (node == null)
                throw new IllegalArgumentException(key + " doesn‘t exist!");
    
            node.value = newValue;
        }
    
        // 返回以node为根的二分搜索树的最小元素所在节点
        private Node minimum(Node node) {
            if (node.left == null) {
                return node;
            }
            return minimum(node.left);
        }
    
        // 删除掉以node为根的二分搜索树中的最小元素所在节点
        // 返回删除节点后新的二分搜索树的根
        private Node removeMin(Node node) {
            if (node.left == null) {
                Node rightNode = node.right;
                node.right = null;
                size--;
                return rightNode;
            }
            node.left = removeMin(node.left);
            return node;
        }
    
        // 实现remove方法
        // 删除二分搜索树中键为key的节点
        @Override
        public V remove(K key) {
            Node node = getNode(root, key);
    
            if (node != null) {
                root = remove(root, key);
                return node.value;
            }
            return null;
        }
    
        // 删除以node为根节点的二分搜索树中键为key的节点,递归算法
        // 返回删除节点后新的二分搜索树的根
        private Node remove(Node node, K key) {
            if (node == null) {
                return null;
            }
    
            if (key.compareTo(node.key) < 0) {
                node.left = remove(node.left, key);
                return node;
            } else if (key.compareTo(node.key) > 0) {
                node.right = remove(node.right, key);
                return node;
            } else {
                // 待删除节点左子树为空的情况
                if (node.left == null) {
                    Node rightNode = node.right;
                    node.right = null;
                    size--;
                    return rightNode;
                    // 待删除节点右子树为空的情况
                } else if (node.right == null) {
                    Node leftNode = node.left;
                    node.left = null;
                    size--;
                    return leftNode;
                    // 待删除节点左右子树均不为空
                    // 找到比待删除节点大的最小节点,即待删除节点右子树的最小节点
                    // 用这个节点顶替待删除节点
                } else {
                    Node successor = minimum(node.right);
                    successor.right = removeMin(node.right);  //这里进行了size--操作
                    successor.left = node.left;
                    node.left = null;
                    node.right = null;
                    return successor;
                }
            }
        }
    }
  • 用二分搜索树实现的映射与用链表实现的映射的性能比较
  • import java.util.ArrayList;
    
    public class Main {
    
        public static double testMap(Map<String, Integer> map, String filename) {
    
            long startTime = System.nanoTime();
    
            System.out.println(filename);
            ArrayList<String> words = new ArrayList<>();
            if (FileOperation.readFile(filename, words)) {
                System.out.println("Total words: " + words.size());
                for (String word : words) {
                    if (map.contains(word)) {
                        map.set(word, map.get(word) + 1);
                    } else {
                        map.add(word, 1);
                    }
                }
    
                System.out.println("Total different words: " + map.getSize());
                System.out.println("Frequency of PRIDE: " + map.get("pride"));
                System.out.println("Frequency of PREJUDICE: " + map.get("prejudice"));
            }
    
            long endTime = System.nanoTime();
    
            return (endTime - startTime) / 1000000000.0;
        }
    
        public static void main(String[] args) {
    
            String filename = "pride-and-prejudice.txt";
    
            LinkedListMap<String, Integer> linkedListMap = new LinkedListMap<>();
            double time1 = testMap(linkedListMap, filename);
            System.out.println("Linked List Map, time: " + time1 + " s");
    
            System.out.println();
            System.out.println();
    
            BSTMap<String, Integer> bstMap = new BSTMap<>();
            double time2 = testMap(bstMap, filename);
            System.out.println("BST Map, time: " + time2 + " s");
    
        }
    }
  • 输出结果
  • pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    Frequency of PRIDE: 53
    Frequency of PREJUDICE: 11
    Linked List Map, time: 9.692566895 s
    
    pride-and-prejudice.txt
    Total words: 125901
    Total different words: 6530
    Frequency of PRIDE: 53
    Frequency of PREJUDICE: 11
    BST Map, time: 0.085364242 s
  • 通过比较结果,我们发现,用二分搜索树实现的映射的比用链表实现的映射更加高效

6.. 映射的时间复杂度

  • 上图中"h"是二分搜索树的高度
  • 当二分搜索树"满"的时候,性能是最佳的,时间复杂度为O(logn);当二分搜索树退化为链表的时候,性能是最差的,时间复杂度为O(n)

原文地址:https://www.cnblogs.com/xuezou/p/9293830.html

时间: 2024-10-29 05:38:22

第二十七篇 玩转数据结构——集合(Set)与映射(Map)的相关文章

第二十三篇 玩转数据结构——栈(Stack)

1.. 栈的特点: 栈也是一种线性结构: 相比数组,栈所对应的操作是数组的子集: 栈只能从一端添加元素,也只能从这一端取出元素,这一端通常称之为"栈顶": 向栈中添加元素的过程,称之为"入栈",从栈中取出元素的过程称之为"出栈": 栈的形象化描述如下图: "入栈"的顺序若为1-2-3-4,那么出栈的顺序只能为4-3-2-1,即,栈是一种"后进先出"(Last In First Out)的数据结构: 从用户的

编程算法 - 二叉搜索树(binary search tree) 集合(set)和映射(map) 代码(C)

二叉搜索树(binary search tree) 集合(set)和映射(map) 代码(C++) 本文地址: http://blog.csdn.net/caroline_wendy 二叉搜索树(binary search tree)作为常用而高效的数据结构, 标准库中包含实现, 在标准库的集合(set)和映射(map), 均使用. 具体操作代码如下. 代码: /* * main.cpp * * Created on: 2014.7.20 * Author: spike */ /*eclipse

第二十二篇 玩转数据结构——构建动态数组

1.. 数组基础 数组就是把数据码成一排进行存放. Java中,数组的每个元素类型必须相同,可以都为int类型,string类型,甚至是自定义类型. 数组的命名要语义化,例如,如果数组用来存放学生的成绩,那么命名为scores就比较合适. 索引(index)是数组中的一个重要概念,它是我们给数组中的每个元素分配的编号,从0开始,依次递增.如果数组中存放了n个元素,第一个元素的索引是0,最后一个元素的索引是n-1. 通过索引,我们可以对数组中的元素进行快速访问,例如,我们访问索引为2的元素也就是数

第二十四篇 玩转数据结构——队列(Queue)

1.. 队列基础 队列也是一种线性结构: 相比数组,队列所对应的操作数是队列的子集: 队列只允许从一端(队尾)添加元素,从另一端(队首)取出元素: 队列的形象化描述如下图: 队列是一种先进先出(First In First Out)的数据结构: 2.. 队列的实现 任务目标如下: Queue<E> ·void enqueue(E) //入队 ·E dequeue() //出队 ·E getFront() //查看队首元素 ·int getSize() //查看队列中元素的个数 ·boolean

第二十六篇 玩转数据结构——二分搜索树

1.. 二叉树 跟链表一样,二叉树也是一种动态数据结构,即,不需要在创建时指定大小. 跟链表不同的是,二叉树中的每个节点,除了要存放元素e,它还有两个指向其它节点的引用,分别用Node left和Node right来表示. 类似的,如果每个节点中有3个指向其它节点的引用,就称其为"三叉树"... 二叉树具有唯一的根节点. 二叉树中每个节点最多指向其它的两个节点,我们称这两个节点为"左孩子"和"右孩子",即每个节点最多有两个孩子. 一个孩子都没有

第二十七篇 类和对象相关知识

类和对象 1. 什么叫类:类是一种数据结构,就好比一个模型,该模型用来表述一类食物(食物即数据和动作的结合体),用它来生产真是的物体(实例) 2. 什么叫对象:睁开眼,你看到的一切事物都是一个个的对象,你可以把对象理解为一个具体的事物(事物即数据和动作的结合体) (铅笔是对象,人是对象,房子是对象,狗是对象,你看到的都是类) 3.类与对象的关系:对象都是由类产生的,女娲造人,首先由一个造人的模板,这个模板就是人类,然后女娲根据类的定义来生产一个个的人 4. 什么叫实例化:由类生产对象的过程叫实例

第二十七篇:Windows驱动中的PCI, DMA, ISR, DPC, ScatterGater, MapRegsiter, CommonBuffer, ConfigSpace

近期有些人问我PCI设备驱动的问题, 和他们交流过后, 我建议他们先看一看<<The Windows NT Device Driver Book>>这本书, 个人感觉, 这本书写得很连贯流畅. PCI设备驱动基本包含了PCI的资源获取, 配置空间的读写, 中断的处理, 中断后半部在DPC中的处理. 同一时候, 也必须了解DMA, ScatterGater, MapRegister, Common Buffer等基础. 1.1 PCI设备资源获取 PCI设备的资源是系统依据设备的属性

Python 学习 第十七篇:元组和集合

元组和集合是Python中的基本类型 一,元组 元组(tuple)由小括号.逗号和数据对象构成的集合,各个项通过逗号隔开,元组的特点是: 元组项可以是任何数据类型,也可以嵌套 元组是一个位置有序的对象的集合,通过偏移来访问元组项, 只不过元组是不可变的,不能在原处修改: 元组的各个项可以重复,例如,一个元组可以是:(1, 1, 2, 2, 3) 1,创建元组 创建空的元组,一个空元组就是一个内控的小括号: >>> t=() 创建包含一个项的元组,t=(1,)是一个元组,t=(1)是一个整

我的第二十七篇博客---beautifulsoup与csv操作方法

Beautiful Soup和lxml一样,也是一个HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML数据lxml只会局部遍历,而Beautiful Soup是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml/Beautiful Soup 用来解析HTML比较简单,API非常人性化,支持CSS选择器,Python标准库中的HTML解析器,也支持lxml的解析器 bs4的基本使用实:首先必须要导入bs4库from b