首发于hi大数据
[剑指offer] 数据流中的中位数

[剑指offer] 数据流中的中位数

本文首发于我的个人博客:尾尾部落

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

解题思路

我们可以将数据排序后分为两部分,左边部分的数据总是比右边的数据小。那么,我们就可以用最大堆和最小堆来装载这些数据:

  • 最大堆装左边的数据,取出堆顶(最大的数)的时间复杂度是O(1)
  • 最小堆装右边的数据,同样,取出堆顶(最小的数)的时间复杂度是O(1)

从数据流中拿到一个数后,先按顺序插入堆中:如果左边的最大堆是否为空或者该数小于等于最大堆顶的数,则把它插入最大堆,否则插入最小堆。然后,我们要保证左边的最大堆的size等于右边的最小堆的size或者最大堆的size比最小堆的size大1。
要获取中位数的话,直接判断最大堆和最小堆的size,如果相等,则分别取出两个堆的堆顶除以2得到中位数,不然,就是最大堆的size要比最小堆的size大,这时直接取出最大堆的堆顶就是我们要的中位数。

参考代码

import java.util.PriorityQueue;
import java.util.Comparator;
public class Solution {
    // 最小堆(右)    
    private PriorityQueue<Integer> rHeap = new PriorityQueue<>(); 
    // 最大堆(左)    
    private PriorityQueue<Integer> lHeap = new PriorityQueue<Integer>(15, new Comparator<Integer>() {
            public int compare(Integer o1, Integer o2) {
                return o2 - o1;
            }
        });
    // 保证lHeap.size()>=rHeap.size()    
    public void Insert(Integer num) {
        // 先按大小插入,再调整        
        if(lHeap.isEmpty() || num <= lHeap.peek())
            lHeap.offer(num);
        else            rHeap.offer(num);
        
        if(lHeap.size() < rHeap.size()){
            lHeap.offer(rHeap.peek());
            rHeap.poll();
        }else if(lHeap.size() - rHeap.size() == 2){
            rHeap.offer(lHeap.peek());
            lHeap.poll();
        }
    }
    public Double GetMedian() {
        if(lHeap.size() > rHeap.size())
            return new Double(lHeap.peek());
        else            
            return new Double(lHeap.peek() + rHeap.peek())/2;
    }
}

编辑于 2018-07-26

文章被以下专栏收录

    大数据,机器学习,深度学习,校招刷题,leetcode。个人博客:www.weiweiblog.cn