C语言实现排序算法之归并排序详解

2024-04-10 07:21:03 291

排序算法中的归并排序(MergeSort)是利用"归并"技术来进行排序。归并是指将若干个已排序的子文件合并成一个有序的文件。

一、实现原理：

1、算法基本思路

设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上：R[low..m]，R[m+1..high]，先将它们合并到一个局部的暂存向量R1(相当于输出堆)中，待合并完成后将R1复制回R[low..high]中。

（1）合并过程

合并过程中，设置i，j和p三个指针，其初值分别指向这三个记录区的起始位置。合并时依次比较R[i]和R[j]的关键字，取关键字较小的记录复制到R1[p]中，然后将被复制记录的指针i或j加1，以及指向复制位置的指针p加1。
重复这一过程直至两个输入的子文件有一个已全部复制完毕(不妨称其为空)，此时将另一非空的子文件中剩余记录依次复制到R1中即可。
最后，将结果赋值的R[]中。

（2）动态申请R1

实现时，R1是动态申请的，因为申请的空间可能很大，故须加入申请空间是否成功的处理。

二、3种方法实现：

算法1：归并函数都动态分配一个数组，两个有序数组合并成一个有序数组

//合并将两个有序序列（[low,mid],[mid+1,high]）合并
voidMerge(intarr[],intlow,intmid,inthigh)
{
inti=low,j=mid+1,p=0;

int*newarr=(int*)malloc((high-low+1)*sizeof(int));//用来暂存排序好的数据
if(!newarr){
printf("mallocerror!\n");
exit(1);
}

while(i<=mid&&j<=high){//以下过程很类似两个有序字符串合并成一个有序字符串
if(arr[i]<arr[j])
newarr[p++]=arr[i++];
else
newarr[p++]=arr[j++];
}

while(i<=mid)
newarr[p++]=arr[i++];
while(j<=high)
newarr[p++]=arr[j++];

for(i=low,p=0;p<(high-low+1);i++,p++)//将结果复制到原数组当中
arr[i]=newarr[p];
free(newarr);
}

算法2：

程序开始处就动态分配一个大数组，避免每次都要创建很多小数组，释放内存的时候，不会立即释放。

有关assert()参见：https://www.nhooo.com/article/39685.htm

/*
*File:mergesort.c
*Time:2014-07-19HJJ
*/
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>

staticvoidmerge1(intarray[],inttmp[],intlpos,intrpos,intrend);
staticvoidmsort1(intarray[],inttmp[],intleft,intright);

voidmerge_sort1(intarray[],intn)
{
assert(array!=NULL&&n>1);//条件不满足，退出程序并打印错误语句。

int*tmp=(int*)malloc(sizeof(int)*n);
assert(tmp!=NULL);
inti;
for(i=0;i<n;i++){
tmp[i]=array[i];
}
msort1(array,tmp,0,n-1);

free(tmp);
}

//递归的调用此函数，实现折半划分，只完成划分，不实现排序，最终返回array[]数组有序
staticvoidmsort1(intarray[],inttmp[],intleft,intright)
{
assert(array!=NULL&&tmp!=NULL);

if(left==right)
return;

intcenter=(left+right)/2;
msort1(tmp,array,left,center);
msort1(tmp,array,center+1,right);
merge1(tmp,array,left,center+1,right);
}

//该函数实现，将array[]的左右两半排好序的数组，归并为tmp[]，并排序
staticvoidmerge1(intarray[],inttmp[],intlpos,intrpos,intrend)
{
assert(array!=NULL&&tmp!=NULL);

intlend=rpos-1;
inttmp_pos=lpos;

while(lpos<=lend&&rpos<=rend){
if(array[lpos]<=array[rpos])
tmp[tmp_pos++]=array[lpos++];
else
tmp[tmp_pos++]=array[rpos++];
}

while(lpos<=lend)
tmp[tmp_pos++]=array[lpos++];
while(rpos<=rend)
tmp[tmp_pos++]=array[rpos++];
}

intmain(intargc,char*argv[])
{
inta[7]={6,5,4,3,2,1,7};

merge_sort1(a,7);
inti;
for(i=0;i<7;i++){
printf("%3d",a[i]);
}
printf("\n");

return0;
}

算法3：
程序开始处分配一个大的数组，只是每次用array[]将数据给tmp[]排好序后，最后再将tmp[]给array[]赋值，这样就能完成每次调用的时候，入口都一样。

voidmerge_sort1(intarray[],intn)
{
assert(array!=NULL&&n>1);//条件不满足，退出程序并打印错误语句。

int*tmp=(int*)malloc(sizeof(int)*n);
assert(tmp!=NULL);
inti;
for(i=0;i<n;i++){
tmp[i]=array[i];
}
msort1(array,tmp,0,n-1);

free(tmp);
}

//递归的调用此函数，实现折半划分，只完成划分，不实现排序，最终返回array[]数组有序
staticvoidmsort1(intarray[],inttmp[],intleft,intright)
{
assert(array!=NULL&&tmp!=NULL);

if(left==right)
return;

intcenter=(left+right)/2;
msort1(tmp,array,left,center);
msort1(tmp,array,center+1,right);
merge(tmp,array,left,center+1,right);
}

实现方法二：

voidmerge(intarray[],inttmp[],intlpos,intrpos,intrend)
{
inti,leftend,num,tmppos;

leftend=rpos-1;
num=rend-lpos+1;
tmppos=lpos;

while(lpos<=leftend&&rpos<=rend){
if(array[lpos]<=array[rpos])
tmp[tmppos++]=array[lpos++];
else
tmp[tmppos++]=array[rpos++];
}

while(lpos<=leftend)
tmp[tmppos++]=array[lpos++];
while(rpos<=rend)
tmp[tmppos++]=array[rpos++];

for(i=0;i<num;i++,rend--)
array[rend]=tmp[rend];
}

归并排序：将一个无序数组合并成一个有序数组

有两种实现方法：自底向上和自顶向下

1、自底向上的方法（自底向上的归并排序算法虽然效率较高，但可读性较差。）

（1）自底向上的基本思想：

自底向上的基本思想是：第1趟归并排序时，将待排序的文件R[1..n]看作是n个长度为1的有序子文件，将这些子文件两两归并，若n为偶数，则得到n/2个长度为2的有序子文件；若n为奇数，则最后一个子文件轮空(不参与归并)。故本趟归并完成后，前logn个有序子文件长度为2，但最后一个子文件长度仍为1；第2趟归并则是将第1趟归并所得到的logn个有序的子文件两两归并，如此反复，直到最后得到一个长度为n的有序文件为止。
上述的每次归并操作，均是将两个有序的子文件合并成一个有序的子文件，故称其为"二路归并排序"。类似地有k(k>2)路归并排序。

（2）一趟归并算法
分析：
在某趟归并中，设各子文件长度为length(最后一个子文件的长度可能小于length)，则归并前R[1..n]中共有个有序的子文件：R[1..length]，R[length+1..2length]，…

注意：

调用归并操作将相邻的一对子文件进行归并时，必须对子文件的个数可能是奇数、以及最后一个子文件的长度小于length这两种特殊情况进行特殊处理：

①若子文件个数为奇数，则最后一个子文件无须和其它子文件归并(即本趟轮空)；
②若子文件个数为偶数，则要注意最后一对子文件中后一子文件的区间上界是n。

具体算法如下：

/*自底向上，这里就不写真正的代码了，从网上copy了*/
voidMergePass(SeqListR，intlength)
{//对R[1..n]做一趟归并排序
inti;
for(i=1;i+2*length-1<=n;i=i+2*length)
Merge(R,i,i+length-1,i+2*length-1);
//归并长度为length的两个相邻子文件
if(i+length-1<n)//尚有两个子文件，其中后一个长度小于length
Merge(R,i,i+length-1，n)；//归并最后两个子文件
//注意：若i≤n且i+length-1≥n时，则剩余一个子文件轮空，无须归并
}//MergePass

voidMergeSort(SeqListR)
{//采用自底向上的方法，对R[1..n]进行二路归并排序
intlength;
for(1ength=1;length<n;length*=2)//做趟归并
MergePass(R，length);//有序段长度≥n时终止
}

2、自顶向下的方法

采用分治法进行自顶向下的算法设计，形式更为简洁。

（1）分治法的三个步骤

设归并排序的当前区间是R[low..high]，分治法的三个步骤是：

①分解：将当前区间一分为二，即求分裂点：mid=(low+high)/2;
②求解：递归地对两个子区间R[low..mid]和R[mid+1..high]进行归并排序；
③组合：将已排序的两个子区间R[low..mid]和R[mid+1..high]归并为一个有序的区间R[low..high]。

递归的终结条件：子区间长度为1（一个记录自然有序）。

具体算法：

voidMSort(intarr[],intlow,inthigh)
{
if(low<high){
intmid=(low+high)/2;
MSort(arr,low,mid);//左半区排序
MSort(arr,mid+1,high);//右半区排序
Merge(arr,low,mid,high);//左右半区合并
}
}

三：分析

1、稳定性
归并排序是一种稳定的排序。

2、存储结构要求
可用顺序存储结构。也易于在链表上实现。

3、时间复杂度
对长度为n的文件，需进行lgn趟二路归并，每趟归并的时间为O(n)，故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。

4、空间复杂度
需要一个辅助向量来暂存两有序子文件归并的结果，故其辅助空间复杂度为O(n)，显然它不是就地排序。

注意：
若用单链表做存储结构，很容易给出就地的归并排序。

C语言实现排序算法之归并排序详解

热门推荐

随机推荐