面试时写不出排序算法？看这篇就够了-胜象大百科-提升认知,打开格局

面试时写不出排序算法？看这篇就够了

冒泡排序

要点

冒泡排序是一种交换排序。

什么是交换排序呢？

交换排序：两两比较待排序的关键字，并交换不满足次序要求的那对数，直到整个表都满足次序要求为止。

算法思想

它重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。

这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端，故名。

假设有一个大小为 N 的无序序列。冒泡排序就是要每趟排序过程中通过两两比较，找到第 i 个小（大）的元素，将其往上排。

以上图为例，演示一下冒泡排序的实际流程：

假设有一个无序序列 { 4. 3. 1. 2, 5 }

第一趟排序：通过两两比较，找到第一小的数值 1 ，将其放在序列的第一位。
第二趟排序：通过两两比较，找到第二小的数值 2 ，将其放在序列的第二位。
第三趟排序：通过两两比较，找到第三小的数值 3 ，将其放在序列的第三位。

至此，所有元素已经有序，排序结束。

要将以上流程转化为代码，我们需要像机器一样去思考，不然编译器可看不懂。

假设要对一个大小为 N 的无序序列进行升序排序（即从小到大）。
每趟排序过程中需要通过比较找到第 i 个小的元素。
所以，我们需要一个外部循环，从数组首端(下标 0) 开始，一直扫描到倒数第二个元素（即下标 N - 2) ，剩下最后一个元素，必然为最大。
假设是第 i 趟排序，可知，前 i-1 个元素已经有序。现在要找第 i 个元素，只需从数组末端开始，扫描到第 i 个元素，将它们两两比较即可。
所以，需要一个内部循环，从数组末端开始（下标 N - 1），扫描到 (下标 i + 1)。

核心代码

public void bubbleSort(int[] list) {
 int temp = 0; // 用来交换的临时数
 // 要遍历的次数
 for (int i = 0; i < list.length - 1; i++) {
 // 从后向前依次的比较相邻两个数的大小，遍历一次后，把数组中第i小的数放在第i个位置上
 for (int j = list.length - 1; j > i; j--) {
 // 比较相邻的元素，如果前面的数大于后面的数，则交换
 if (list[j - 1] > list[j]) {
 temp = list[j - 1];
 list[j - 1] = list[j];
 list[j] = temp;
 }
 }
 System.out.format("第 %d 趟：t", i);
 printAll(list);
 }
}
复制代码

算法分析

冒泡排序算法的性能

参数结果排序类别交换排序排序方法冒泡排序时间复杂度平均情况 O(N2) 时间复杂度最坏情况 O(N3) 时间复杂度最好情况 O(N) 空间复杂度 O(1) 稳定性稳定复杂性简单时间复杂度

若文件的初始状态是正序的，一趟扫描即可完成排序。所需的关键字比较次数 C 和记录移动次数 M 均达到最小值：Cmin = N - 1, Mmin = 0。所以，冒泡排序最好时间复杂度为 O(N)。

若初始文件是反序的，需要进行 N -1 趟排序。每趟排序要进行 N - i 次关键字的比较(1 ≤ i ≤ N - 1)，且每次比较都必须移动记录三次来达到交换记录位置。在这种情况下，比较和移动次数均达到最大值：

Cmax = N(N-1)/2 = O(N2)

Mmax = 3N(N-1)/2 = O(N2)

冒泡排序的最坏时间复杂度为 O(N2)。

因此，冒泡排序的平均时间复杂度为 O(N2)。

总结起来，其实就是一句话：当数据越接近正序时，冒泡排序性能越好。

算法稳定性

冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较，交换也发生在这两个元素之间。

所以相同元素的前后顺序并没有改变，所以冒泡排序是一种稳定排序算法。

优化

对冒泡排序常见的改进方法是加入标志性变量 exchange，用于标志某一趟排序过程中是否有数据交换。

如果进行某一趟排序时并没有进行数据交换，则说明所有数据已经有序，可立即结束排序，避免不必要的比较过程。

核心代码

// 对 bubbleSort 的优化算法
public void bubbleSort_2(int[] list) {
 int temp = 0; // 用来交换的临时数
 boolean bChange = false; // 交换标志
 // 要遍历的次数
 for (int i = 0; i < list.length - 1; i++) {
 bChange = false;
 // 从后向前依次的比较相邻两个数的大小，遍历一次后，把数组中第i小的数放在第i个位置上
 for (int j = list.length - 1; j > i; j--) {
 // 比较相邻的元素，如果前面的数大于后面的数，则交换
 if (list[j - 1] > list[j]) {
 temp = list[j - 1];
 list[j - 1] = list[j];
 list[j] = temp;
 bChange = true;
 }
 }
 // 如果标志为false，说明本轮遍历没有交换，已经是有序数列，可以结束排序
 if (false == bChange)
 break;
 System.out.format("第 %d 趟：t", i);
 printAll(list);
 }
}
复制代码

示例代码

我的 Github 测试例

样本包含：数组个数为奇数、偶数的情况；元素重复或不重复的情况。且样本均为随机样本，实测有效。

快速排序

要点

快速排序是一种交换排序。

快速排序由 C. A. R. Hoare 在 1962 年提出。

算法思想

它的基本思想是：

通过一趟排序将要排序的数据分割成独立的两部分：分割点左边都是比它小的数，右边都是比它大的数。

然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

详细的图解往往比大堆的文字更有说明力，所以直接上图：

上图中，演示了快速排序的处理过程：

初始状态为一组无序的数组：2、4、5、1、3。
经过以上操作步骤后，完成了第一次的排序，得到新的数组：1、2、5、4、3。
新的数组中，以 2 为分割点，左边都是比 2 小的数，右边都是比 2 大的数。
因为 2 已经在数组中找到了合适的位置，所以不用再动。
2 左边的数组只有一个元素 1，所以显然不用再排序，位置也被确定。（注：这种情况时，left 指针和 right 指针显然是重合的。因此在代码中，我们可以通过设置判定条件 left 必须小于 right，如果不满足，则不用排序了）。
而对于 2 右边的数组 5、4、3，设置 left 指向 5，right 指向 3，开始继续重复图中的一、二、三、四步骤，对新的数组进行排序。

核心代码

public int division(int[] list, int left, int right) {
 // 以最左边的数(left)为基准
 int base = list[left];
 while (left < right) {
 // 从序列右端开始，向左遍历，直到找到小于base的数
 while (left < right && list[right] >= base)
 right--;
 // 找到了比base小的元素，将这个元素放到最左边的位置
 list[left] = list[right];
 // 从序列左端开始，向右遍历，直到找到大于base的数
 while (left < right && list[left] <= base)
 left++;
 // 找到了比base大的元素，将这个元素放到最右边的位置
 list[right] = list[left];
 }
 // 最后将base放到left位置。此时，left位置的左侧数值应该都比left小；
 // 而left位置的右侧数值应该都比left大。
 list[left] = base;
 return left;
}
private void quickSort(int[] list, int left, int right) {
 // 左下标一定小于右下标，否则就越界了
 if (left < right) {
 // 对数组进行分割，取出下次分割的基准标号
 int base = division(list, left, right);
 System.out.format("base = %d:t", list[base]);
 printPart(list, left, right);
 // 对“基准标号“左侧的一组数值进行递归的切割，以至于将这些数值完整的排序
 quickSort(list, left, base - 1);
 // 对“基准标号“右侧的一组数值进行递归的切割，以至于将这些数值完整的排序
 quickSort(list, base + 1, right);
 }
}
复制代码

算法分析

快速排序算法的性能

参数结果排序类别交换排序排序方法快速排序时间复杂度平均情况 O(Nlog2N) 时间复杂度最坏情况 O(N2) 时间复杂度最好情况 O(Nlog2N) 空间复杂度 O(Nlog2N) 稳定性不稳定复杂性较复杂时间复杂度

当数据有序时，以第一个关键字为基准分为两个子序列，前一个子序列为空，此时执行效率最差。

而当数据随机分布时，以第一个关键字为基准分为两个子序列，两个子序列的元素个数接近相等，此时执行效率最好。

所以，数据越随机分布时，快速排序性能越好；数据越接近有序，快速排序性能越差。

空间复杂度

快速排序在每次分割的过程中，需要 1 个空间存储基准值。而快速排序的大概需要 Nlog2N 次的分割处理，所以占用空间也是 Nlog2N 个。

算法稳定性

在快速排序中，相等元素可能会因为分区而交换顺序，所以它是不稳定的算法。

胜象大百科