线性算法 排序之归并

排序分类

很多人对排序分类不是很清楚,其实我也不清楚,但是我可以发表一下自己的见解。排序算法分为两类,内部排序和外部排序。内部排序一般指的就是数据在内存里面的排序算法,数据量一般比较少。最大不多于2G,毕竟这就把用户进程地址全部占用了,其实根本不可能,卡死得。外部排序一般指的是数据在文件里面存放着,不排除数据库里面存放着。内部和外部的排序联系就是在这里了。大名鼎鼎的归并排序。

归并

外部排序先把数据分成可以加载到内存的一些数据段,每一个数据段先排序,最后呢,利用归并排序排好再次存放到文件当中。归并排序可以有很多路,作为研究文章一般都是最典型的二路排序,再多的话就需要和需求相关了。数据量很不幸一般都不知道,所以用的是单链表节点。可以看看二路归并的实现了。

实现

#include <stdio.h>
#include <malloc.h>
#include <memory.h>

/************************************************************************
	@ 链表节点
	@ data -- 节点数据
	@ next -- 下一个节点指针
************************************************************************/
typedef struct node
{
	int data;
	struct node* next;
}node;

/************************************************************************
	@ 链表插入节点
************************************************************************/
int node_insert(struct node* the_node,int data)
{
	//找最后节点
	struct node *cur_node=the_node;
	while (cur_node->next != NULL)
	{
		cur_node=cur_node->next;
	}

	//创建新节点
	struct node* new_node=(struct node*)malloc(sizeof(struct node)*1);
	new_node->data=data;
	new_node->next=NULL;

	//添加新节点
	cur_node->next=new_node;

	return 0;
}

/************************************************************************
	@ 释放链表
************************************************************************/
int node_free(struct node* the_node)
{
	struct node* cur_node=NULL;
	while(the_node != NULL)
	{
		cur_node=the_node;
		the_node=the_node->next;
		free(cur_node);
		cur_node=NULL;
	}

	return 0;
}

/************************************************************************
	@ 链表归并
************************************************************************/
int list_merge(struct node* first,struct node* second,struct node** result)
{
	//记录操作节点
	struct node** cur_result=result;

	//选择小的
	while(first != NULL && second != NULL)
	{
		if (first->data < second->data)
		{
			*cur_result=first;
			cur_result=&((*cur_result)->next);
			first=first->next;
		}
		else
		{
			*cur_result=second;
			cur_result=&((*cur_result)->next);
			second=second->next;
		}
	}

	//处理剩余
	if (first != NULL)
	{
		*cur_result=first;
	}
	//处理剩余
	if (second != NULL)
	{
		*cur_result=second;
	}

	return 0;
}

/************************************************************************
	@ 主函数 -- 程序入口点
************************************************************************/
int main()
{
	//创建第一个链表
	struct node* first=(struct node*)malloc(sizeof(struct node)*1);
	first->data=1;
	first->next=NULL;
	for (int i=2;i<10;i++)
	{
		node_insert(first,i);
	}

	//创建第二个链表
	struct node* second=(struct node*)malloc(sizeof(struct node)*1);
	second->data=2;
	second->next=NULL;
	for (int i=14;i<100;i++)
	{
		node_insert(second,i);
	}

	//归并排序
	struct node* result=NULL;
	list_merge(first,second,&result);

	//输出结果
	struct node* out_result=result;
	while (out_result != NULL )
	{
		printf("%d ___ ",out_result->data);
		out_result=out_result->next;
	}

	//释放链表
	node_free(result);
	result=NULL;
	first=NULL;
	second=NULL;

	return 0;
}

运行结果

有图为证

总结

1.二路归并最核心的就是merge里面的while循环了。比较大小。

2.再次就是剩余数据的处理,照样是while循环,我们不知道有多少个数据留下毕竟。

3.其他的就是单链表数据结构的典型构建了。

时间: 2024-10-03 02:10:03

线性算法 排序之归并的相关文章

排序算法(4)-线性时间排序

在前面三节排序算法中,我们分别分析了不同策略,思想用于排序,而这些算法都是基于数据间的比较来确定顺序的.假设我不用比较,换一种思路,那么就可以达到时间复杂度为O(n)的排序算法,当然是以付出额外的空间为代价的. 一.基本思想 线性时间排序的算法思想: (1):在计数排序中,利用比x小或等的元素个数和的来确定x位置.比如2 5 4 9 1 6.9比其余5个数都大,那就说明9 在排序后的第6个位置,这样我们只要得到比某个数大的元素个数就能得到元素在排序后数组中的位置了. (2):在桶排序中,是通过映

算法导论 第八章 线性时间排序(python)

比较排序:各元素的次序依赖于它们之间的比较{插入排序O(n**2) 归并排序O(nlgn) 堆排序O(nlgn)快速排序O(n**2)平均O(nlgn)} 本章主要介绍几个线性时间排序:(运算排序非比较排序)计数排序O(k+n)基数排序O() 第一节:用决策树分析比较排序的下界 决策树:倒数第二层满,第一层可能满的二叉树,它用来表示所有元素的比较操作{于此来分析下界},忽略控制,移动操作 1:2 #A[1]和A[2]比 <= 走左边 >走右边 <3,1,2> 最后的结果 下标对应排

算法导论 第8章 线性时间排序

合并排序和堆排序的时间复杂度为O(nlgn),插入排序和冒泡排序的时间复杂度为O(n^2),快速排序的时间复杂度在平均情况下是O(nlgn),这些排序算法都是通过对元素进行相互比较从而确定顺序的,因此都叫比较排序. 比较排序可以看做是决策树(一个满二叉树),因为每一次比较都是一个分支.n个元素的序列,其排序的结果有 n! 种可能(n个元素的全排),所以这个决策树有 n! 个叶子结点,假设树的高度为h,则有:n! <= 2^h,所以h >= lg(n!) = Ω(nlgn).一次比较排序就是从决

算法导论-- 线性时间排序(计数排序、基数排序、桶排序)

线性时间排序 前面介绍的几种排序,都是能够在复杂度nlg(n)时间内排序n个数的算法,这些算法都是通过比较来决定它们的顺序,这类算法叫做比较排序 .下面介绍的几种算法用运算去排序,且它们的复杂度是线性时间. -------------------------------------- 1.计数排序 计数排序采用的方法是:对每个元素x,去确定小于x的元素的个数,从而就可以知道元素x在输出数组中的哪个位置了. 计数排序的一个重要性质是它是稳定的,即对于相同的两个数,排序后,还会保持它们在输入数组中的

线性时间排序算法

线性时间排序算法列表 线性时间排序 Name Average Worst Memory Stable Description  计数排序 (Counting Sort) n + k n + k n + k Stable Indexes using key values.  基数排序 (Radix Sort) n * k  n * k n + k Stable Examines individual bits of keys.  桶排序 (Bucket Sort) n + k n2 n * k S

算法导论第八章线性时间排序

一.线性时间排序算法历史概览 计数排序首先是由 Harold H. Seward 于1954年提出,而且他还提出将计数排序和基数排序进行结合的思想:基数排序是L.J.Comrie于1929年首次在一篇描述卡片穿孔机文档中提出的一种方法,它是从最低有效位开始,对一个有多位数组成的数进行排序的方法:而桶排序的基本思想则由E.J.Isaac和R.C.Singleton于1956年提出的,之后很多研究人员在这三种算法的基础上针对不同的应用场景又进一步改进,到了今天一个很成熟.很通用的地步. 二.O(nl

算法导论之六:线性时间排序之 决策树&amp;计数排序

本系列前五篇都是讲述的比较排序算法,从本文开始,将进入线性时间排序.什么是比较排序,简单的说,就是排序的过程依赖于数组中数据大小的比较,从而来确定数据在排好序输出时的位置. 比较排序法比较直观,但是也有它的不足,我们容易证明任何比较排序法,在最坏的情况下的时间复杂度的下限都是 nlgn.要证明这个问题,我们首先要搞清楚一个模型:决策树模型. 一.决策树模型 什么是决策树?决策树从形态上来讲,是一颗完全二叉树,它除叶子节点之外,其他层的节点都是满的.它的每一个叶子节点表示对输入数据组合的一种排序可

算法导论——lec 08 线性时间排序

之前我们介绍了几种O(nlgn)的排序算法:快速排序.合并排序和堆排序,本节我们介绍基于比较的排序算法的下界以及几个线性时间的排序算法--计数排序.基数排序.桶排序. 一. 比较排序算法的下界 1. 决策树模型:比较排序可以被抽象的视为决策树.一棵决策树是一棵满二叉树,表示某排序算法 作用于给定输入所做的所有比较. 排序算法的执行对应于遍历一条从树的根到叶结点的路径.在每个内节结点处要做比较. 要使排序算法能正确的工作,其必要条件是,n 个元素的n!种排列中的每一种都要作为决策树 的一个叶子而出

算法导论第二章C++实现归并算法排序

归并算法排序的思想算法导论中讲的还算比较清楚. #include<iostream> using namespace std; void guibing(int *_array,int p,int q,int r); void merge_sort(int *_array,int p,int r); int main() { int a[8]={2,4,5,7,1,2,3,6}; int j1=0; int j2=7; merge_sort(a,j1,j2); int i=0; for(;i&