『初阶数据结构 • C语言』⑥ - 插入排序和amp;希尔排序

第 1轮先从索引 1开始，其值为 2。

准备工作：暂时移走 2，并将其保存在变量 tmp 中。图中被移到数组上方的就是
tmp。

第 1步：比较 4与 tmp中的 2。

第 2步：因为 4大于 2，所以把 4右移。

于是空隙移到了数组最左端，没有其他值可以比较了。

第 3步：将 tmp插回数组，完成第一轮。

开始第 2轮。

准备工作：暂时移走索引 2的值，并保存到 tmp中。于是 tmp等于 7。

第 4步：比较 4与 tmp。

4小于 7，所以无须平移。因为遇到了小于 tmp的值，所以平移阶段结束。

第 5步：将 tmp插回到空隙中，结束第 2轮。

开始第 3轮。

准备工作：暂时移走 1，并将其保存到 tmp中。

第 6步：比较 7与 tmp。

第 7步：7大于 1，于是将 7右移。

第 8步：比较 4与 tmp。

第 9步：4大于 1，于是也要将 4右移。

第 10步：比较 2与 tmp。

第 11步：2比较大，所以将 2右移。

第 12步：空隙到了数组最左端，因此我们将 tmp插进去，结束这一轮。

开始第 4轮。

准备工作：暂时移走索引 4的值 3，保存到 tmp中。

第 13步：比较 7和 tmp。

第 14步：7更大，于是将 7右移。

第 15步：比较 4与 tmp。

第 16步：4大于 3，所以将 4右移。

第 17步：比较 2与 tmp。2 小于 3，于是平移阶段完成。

第 18步：把 tmp插回到空隙。

至此整个数组都排好序了。

3.插入排序的实现

以下使用C语言实现的直接插入排序：

void InsertSort(int* a, int n)
{
for (int i = 0; i < n - 1; i )
{
int end = i;
int tmp = a[end 1];
while (end >= 0)
{
if (a[end] > tmp) //大于tmp，往后挪一个
{
a[end 1] = a[end];
end--;
}
else
{
break;
}
}
a[end 1] = tmp; //把tmp插入空隙
}
}

让我们一步步来讲解：

for (int i = 0; i < n - 1; i  )

最外层的这个循环用来控制end的位置，也就是一个轮回。

int end = i;
int tmp = a[end 1];

我们通过控制end的位置，使end与end之前的数列都是有序的，而把end 1索引处的值（也就是tmp）插入到end之前的数列中。所以，end的值是从0开始的。这样能保证end与end之前的数列是有序的（因为只有一个数），那么将tmp插入后，前end 1个数都是有序的，再依次执行下去。

学新通

while (end >= 0)

end索引处的值会发生移动，最坏的情况是tmp的值比之前的有序数列中每一个值都要小，那么空隙的位置就在end=0处。例如：

学新通

if (a[end] > tmp) //大于tmp，往后挪一个
{
a[end 1] = a[end];
end--;
}
else
{
break;
}

找到空隙，将比tmp大的数字不断往后挪，直到找到小于等于tmp的数字。

a[end   1] = tmp;          //把tmp插入空隙

将tmp插入空隙。

4.插入排序的效率

插入排序包含 4种步骤：移除、比较、平移和插入。要分析插入算法的效率，就得把每种步骤都统计一遍。

首先看看比较。每次拿 tmp跟空隙左侧的值比大小就是比较。

在数组完全逆序的最坏情况下，我们每一轮都要将 tmp左侧的所有值与tmp比较。因为那些值全都大于 tmp，所以每一轮都要等到空隙移到最左端才能结束。

对于含有N个元素的数组，可以得出比较的总次数为：

1 2 3 … N - 1 次。

接下来看看其他几种步骤。

我们每次将值右移一格，就是平移操作。当数组完全逆序时，有多少次比较就要多少次平移，因为每次比较的结果都会使你将值右移。

因而可以得出平移的总次数为：

1 2 3 … N - 1 次。

tmp的移除跟插入在每一轮里都会各发生一次。因为总是有 N - 1轮，所以可以得出结论：有 N - 1次移除和 N - 1次插入。

把它们都相加。

N^2 比较和平移的合计
N - 1 次移除
N - 1 次插入
=
N^2 2N - 2步

我们已经知道大 O有一条重要规则——忽略常数，于是你可能会将其简化成 O(N^2 N)。不过，现在来学习一下大 O的另一条重要规则：

大 O 只保留最高阶的 N。

换句话说，如果有个算法需要 N^4 N^3 N^2 N步，我们就只会关注其中的 N^4 ，即以 O(N^4 )
来表示。为什么呢？

请看下表。

学新通

随着 N的变大，N^4 的增长越来越抛离其他阶。当 N为 1000时，N^4 就比 N^3 大了 1000倍。因
此，我们只关心最高阶的 N。
所以在插入排序的例子中，O(N^2 N)还得进一步简化成 O(N^2 )。

不过上一章曾指出，虽然冒泡排序和选择排序都是 O(N^2 )，但选择排序实际上是 N^2 / 2步，
比 N 2 步的冒泡排序更快。乍一看，你可能会觉得插入排序跟冒泡排序一样，因为它们都是 O(N^2 )，其实插入排序是 N^2 2N - 2步。你或许会认为比冒泡排序和插入排序快一倍的选择排序是三者中最优的，但事情并没有这么简单。

5.平均情况

确实，在最坏情况里，选择排序比插入排序快。但是我们还应该考虑平均情况。

最好情况和最坏情况很少发生。现实世界里，最常出现的是平均情况。

这是很有道理的。你设想一个随便洗乱的数组，出现完全升序或完全降序的可能性有多大？最可能出现的情况应该是随机分布。

下面试试在各种场景中测试插入排序。

完全降序的最坏情况之前已经见过，它每一轮都要比较和平移所遇到的值（这两种操作合计N^2 步）。

对于完全升序的最好情况，因为所有值都已在其正确的位置上，所以每一轮只需要一次比较，完全不用平移。

最坏情况是所有数据都要比较和平移；最好情况是每轮一次比较、零次平移；对于平均情况，总的来看，是比较和平移一半的数据。

如果说插入排序的最坏情况需要 N 2 步，那么平均情况就是 N 2 / 2步。尽管最终大 O都会写成 O(N^2 )。

可以看到插入排序的性能在不同场景中差异很大。最坏、平均、最好情况，分别需要 N^2 、
N^2 / 2、N步。

那么哪种算法更好？选择排序还是插入排序？答案是：看情况。对于平均情况（数组里的值随机分布），它们性能相近。如果你确信数组是大致有序的，那么插入排序比较好。如果是大致逆序，则选择排序更快。

6.希尔排序

希尔排序是对插入排序做了简单的优化，却产生了质的飞跃。直接让不太起眼的插入排序比肩闻名算法界的快速排序。我们知道对于插入排序，数据的元素越是接近有序，那么它的效率就越高；对于完全有序的数组，它甚至可以快到O(N)。

那么希尔排序的主要思想是，我们不断地对数组进行预排序，使数组里大的元素尽量到数组的后面，小的元素尽量到数组的前面。

完成对数组的预排序看，我们采取的方法是对数组进行分组，把数组里间隔相同长度的元素划分为一组。例如：

学新通

接下来我们对每一组的元素进行排序。

学新通

如图所示，第一趟排序，较大的元素已经到了数组的后面了。接下来再次重新分组，再次预排序：

学新通

经过第二趟预排序，我们发现数组已经大致接近有序了，那么最后一次，我们取间隔为1分组，其实就是一次普通的插入排序：

学新通

至此，数组已经完全有序了。

通过上面的例子不难看出，希尔排序就是对插入排序的简单优化，引入了预排序的概念。

当gap>1时，进行的是预排序（也就是对每一组进行插入排序）；

当gap=1时，进行对整个数组的插入排序。

7.希尔排序的实现

下面使用C语言实现的希尔排序：

void ShellSort(int* a, int n)
{
int gap = n; //间隔
while (gap > 1)
{
gap = gap / 3 1; // 1是为了使gap最后等于1
for (int i = 0; i < n - gap; i )
{
int end = i;
int tmp = a[end gap];
while (end >= 0)
{
if (tmp < a[end])
{
a[end gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end gap] = tmp;
}
}
}

代码相较于插入排序并没有改变多少，在插入排序的基础上多了一层循环用来控制gap。

此处可以看出，预排序并不是固定的3次或者4次。而是取决于数组元素个数，这么做一是为了方便控制gap，二是预排序越多次，对整体排序而言更有利，所以我们不用吝啬预排序，并不是预排序越多，花费的步数就越多，时间复杂度就越高。

gap = gap / 3   1;

除了这样控制gap外，还有一种常用的方法：

gap = gap / 2;

但是根据有人实验得出，第一种方式比第二种方式快一点点，但是差距很细微，所以两者皆可。

8.希尔排序的效率

希尔排序的时间复杂度并不好算，因为每次取gap的值都不同，而且gap取不同值的情况下，每次预排序所面临的数据也不同。希尔排序的时间复杂度计算需要运用到数学知识，而且目前为止我们也没有得到严格的标准答案。有人在大量实验的基础上得出希尔排序的时间复杂度接近O(N^1.3)。

《数据结构(C语言版)》--- 严蔚敏

学新通

《数据结构-用面相对象方法与C 描述》--- 殷人昆

学新通

因为我们的gap取值的方式是按照Knuth的方式取的，所以以我们这种方式实现的希尔排序时间复杂度暂定为O(N^1.25)。

目前仅仅靠时间复杂度的对比，我们也许感受不到什么叫做质的飞跃，那我们就通过一组数据来对比一下二者的差距。

这是一个测试排序算法所用时间的函数：

void TestOP()
{
srand(time(0));
const int N = 1000000;
int* a1 = (int*)malloc(sizeof(int) * N);
int* a2 = (int*)malloc(sizeof(int) * N);
int* a3 = (int*)malloc(sizeof(int) * N);
int* a4 = (int*)malloc(sizeof(int) * N);
int* a5 = (int*)malloc(sizeof(int) * N);
int* a6 = (int*)malloc(sizeof(int) * N);
int* a7 = (int*)malloc(sizeof(int) * N);
int j = 0;
for (int i = 0; i < N; i)
{
a1[i] = rand();
a2[i] = a1[i];
a3[i] = a1[i];
a4[i] = a1[i];
a5[i] = a1[i];
a6[i] = a1[i];
a7[i] = a1[i];
}
printf("%d\n", j);
int begin1 = clock();
InsertSort(a1, N);
int end1 = clock();
int begin2 = clock();
ShellSort(a2, N);
int end2 = clock();
int begin3 = clock();
//SelectSort(a3, N);
int end3 = clock();
int begin4 = clock();
//HeapSort(a4, N);
int end4 = clock();
int begin7 = clock();
//BubbleSort(a7, N);
int end7 = clock();
int begin5 = clock();
//QuickSort(a5, 0, N - 1);
int end5 = clock();
int begin6 = clock();
//MergeSort(a6, N);
int end6 = clock();
printf("InsertSort:%d\n", end1 - begin1);
printf("ShellSort:%d\n", end2 - begin2);
printf("SelectSort:%d\n", end3 - begin3);
printf("HeapSort:%d\n", end4 - begin4);
printf("BubbleSort:%d\n", end7 - begin7);
printf("QuickSort:%d\n", end5 - begin5);
printf("MergeSort:%d\n", end6 - begin6);
free(a1);
free(a2);
free(a3);
free(a4);
free(a5);
free(a6);
}

我们以排序1百万个元素为例，得到以下结果：

学新通

很显然两种排序算法已经不在一个数量级了。

9.总结

懂得区分最好、平均、最坏情况，是为当前场景选择最优算法以及给现有算法调优以适应环境变化的关键。记住，虽然为最坏情况做好准备十分重要，但大部分时间我们面对的是平均情况。

学新通

这篇好文章是转载于：学新通技术网

『初阶数据结构 • C语言』⑥ - 插入排序和amp;希尔排序

写在前面

1.插入排序

2.插入排序实战

3.插入排序的实现

4.插入排序的效率

5.平均情况

6.希尔排序

7.希尔排序的实现

8.希尔排序的效率

9.总结

photoshop保存的图片太大微信发不了怎么办

Android 11 保存文件到外部存储，并分享文件

word里面弄一个表格后上面的标题会跑到下面怎么办

《学习通》视频自动暂停处理方法

微信公众号没有声音提示怎么办

photoshop扩展功能面板显示灰色怎么办

excel下划线不显示怎么办

怎样阻止微信小程序自动打开

excel打印预览压线压字怎么办

photoshop蒙版画笔没反应怎么办