一、前言
本系列文章为《剑指Offer》刷题笔记。
刷题平台:牛客网
书籍下载:共享资源
二、题目
输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4。
1、思路
最简单的方法就是先排序,然后在遍历输出最小的K个数,方法简单粗暴。
2、代码
C++:
class Solution { public: vector<int> GetLeastNumbers_Solution(vector<int> input, int k) { vector<int> result; if(input.empty() || k > input.size()){ return result; } sort(input.begin(), input.end()); for(int i = 0; i < k; ++i){ result.push_back(input[i]); } return result; } };
3、优化
上述算法的时间复杂度为O(n^2),速度慢。另一种O(nlogk)的算法是基于堆排序的,特别适合处理海量数据。
我们可以先创建一个大小为k的数据容器来存储最小的k个数字,接下来我们每次从输入的n个整数中的n个整数中读入一个数。如果容器中已有的数字少于k个,则直接把这次读入的整数放入容器之中;如果容器已经有k个数字了,也就是容器满了,此时我们不能再插入新的数字而只能替换已有的数字。找出这已有的k个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还要大,那么这个数不可能是最小的k个整数之一,于是我们可以抛弃这个整数。
因此当容器满了之后,我们要做3件事情:一是在k个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能要插入一个新的数字。如果用一个二叉树来实现这个数据容器,那么我们在O(logk)时间内实现这三步操作。因此对于n个输入数字而言,总的时间效率就是O(nlogk)。
C++:
class Solution { public: vector<int> GetLeastNumbers_Solution(vector<int> input, int k) { vector<int> result; int length = input.size(); if(length <= 0 || k <= 0 || k > length){ return result; } for(int i = 0; i < input.size(); i++){ if(result.size() < k){ result.push_back(input[i]); } else{ for(int j = k / 2; j >= 0; j--){ HeadAdjust(result, j, k); } for(int j = k - 1; j > 0; j--){ swap(result[0], result[j]); HeadAdjust(result, 0, j); } if(result[k-1] > input[i]){ result[k-1] = input[i]; } } } return result; } private: void HeadAdjust(vector<int> &input, int parent, int length){ int temp = input[parent]; int child = 2 * parent + 1; while(child < length){ if(child + 1 < length && input[child] < input[child+1]){ child++; } if(temp >= input[child]){ break; } input[parent] = input[child]; parent = child; child = 2 * parent + 1; } input[parent] = temp; } };
对于上述代码,我们还可以进一步优化,不是每次循环都需要重新排序的,只有在更新了容器的数据之后,才需要重新排序。
进一步优化:
class Solution { public: vector<int> GetLeastNumbers_Solution(vector<int> input, int k) { vector<int> result; int length = input.size(); bool change = true; if(length <= 0 || k <= 0 || k > length){ return result; } for(int i = 0; i < input.size(); i++){ if(result.size() < k){ result.push_back(input[i]); } else{ if(change == true){ for(int j = k / 2; j >= 0; j--){ HeadAdjust(result, j, k); } for(int j = k - 1; j > 0; j--){ swap(result[0], result[j]); HeadAdjust(result, 0, j); } change = false; } if(result[k-1] > input[i]){ result[k-1] = input[i]; change = true; } } } return result; } private: void HeadAdjust(vector<int> &input, int parent, int length){ int temp = input[parent]; int child = 2 * parent + 1; while(child < length){ if(child + 1 < length && input[child] < input[child+1]){ child++; } if(temp >= input[child]){ break; } input[parent] = input[child]; parent = child; child = 2 * parent + 1; } input[parent] = temp; } };
Python:
用数组的方法:
# -*- coding:utf-8 -*- class Solution: def GetLeastNumbers_Solution(self, tinput, k): if len(tinput) < k: return [] tmp = sorted(tinput[:k]) for each in tinput[k:]: index = k - 1 flag = False while index >= 0 and tmp[index] > each: index -= 1 flag = True if flag == True: tmp.insert(index+1, each) tmp.pop() return tmp
用堆排序的方法:
# -*- coding:utf-8 -*- class Solution: def HeadAdjust(self, input_list, parent, length): temp = input_list[parent] child = 2 * parent + 1 while child < length: if child + 1 < length and input_list[child] < input_list[child+1]: child += 1 if temp >= input_list[child]: break input_list[parent] = input_list[child] parent = child child = 2 * parent + 1 input_list[parent] = temp def GetLeastNumbers_Solution(self, tinput, k): # write code here res = [] length = len(tinput) change = True if length <= 0 or k <= 0 or k > length: return res res = tinput[:k] for i in range(k, length+1): if change == True: for j in range(0, k//2+1)[::-1]: self.HeadAdjust(res, j, k) for j in range(1, k)[::-1]: res[0], res[j] = res[j], res[0] self.HeadAdjust(res, 0, j) chage = False if i != length and res[k-1] > tinput[i]: res[k-1] = tinput[i] chage = True return res
来源:
https://cuijiahua.com/blog/2017/12/basis_29.html