过程记录
4个月前C语言版的七大排序算法实践让我在写C++版时轻车熟路。特别是冒泡,插入,希尔,选择这四种排序不用调试即运行成功。
输出的效果与C语言做的版本完全一样,其中令我印象深刻的是,cout对浮点的处理远不如printf简单明了。非常让开发者难受。
写C++版时有所改进。
#define sortfunc _selsort
可以用
typedef void (*sort_t)(vector<int>& arr); sort_t sortfunc = _selsort;
两句代替。
也缩短了把函数指针作参数书写的长度。
很奇怪,又发现C语言版的堆排序是有问题的。
这次先把C++版堆写对了再回头写C语言版。写完后对堆理解加深不少。
堆具有几点性质:
1、任意arr[i/2]<= arr[i]。
2、堆顶元素最小。
3、堆对应数组下标为1..n。
4、最坏插入删除一个元素只需log2n,构造堆最坏nlog2n时间,但是处理平常输入的数据通常不如快速排序。
堆排序算法:
1、待排序目标是arr[1]到arr[n]
2、造堆
a)前n-1号已经满足堆性质。增加一个n号,移动n号造堆,使得前n号为止都满足堆。
b)考虑n/2,n(如果n是奇数则考虑n/2,n,n-1),交换n与n/2或交换n-1与n/2,使得n/2最小。(注:n/2总是整数)
c)若b)没交换,到d);若b)发生交换,使n=n/2,重复b)操作。
d)前n号满足堆,使n=n+1,重复a)操作直到成功。
3、尖堆
a)1到n号具有堆性质,所以1号最小,交换1和n号并移动1号使1到n-1号重新恢复堆。
b)j=1,考虑j,j*2,j*2+1,交换j与j*2或交换j与j*2+1使得j最小。
c)若b)没交换,到d);若b发生交换,j=j*2(或j*2+1,看交换的是哪个),重复b)。
d)1到n-1号具有堆性质,使n=n-1,重复a)。
4、反序
5、arr[1]到arr[n]已排序
(以上算法描述个人原创,代码虽易,描述不易,且描且珍惜……)
C++的(vector)版
void _hsort(vector<int>& arr, int len){ // vector<int> arrtmp (len+1); arr.resize(len+1); int i,j,k; // 右移一位 for (i=len;i>=1;i--) // bug! i>1 arr[i] = arr[i-1]; // 造堆 for (i=2;i<=len;i++){ /* 这种就是用while比for好 for (j=i/2;j>1 && arr[j]<arr[j/2];j/=2) swap(arr[j], arr[j/2]); */ j = i; while (j>1){ k = j/2; if (j%2 && arr[j-1]<arr[j]) j -= 1; if (arr[j]<arr[k]) swap(arr[j], arr[k]); j = k; } } // 交换头尾,恢复推性质,直至反序排列 for (i=len;i>1;i--){ swap(arr[1], arr[i]); //bug! 现在只要回复1到i-1的堆性质,而不是到i j = 1; while (j<i-1) { k = j*2; if (k>i-1) break; // 小的先上,冒泡味道 if (k+1 <=i-1 && arr[k] > arr[k+1]) k += 1; if (arr[j]>arr[k]) swap(arr[j], arr[k]); j = k; } } // 反序 i=1;j=len; while (i < j){ swap(arr[i], arr[j]); i++;j--; } // 复位 for (i=0;i<len;i++) arr[i] = arr[i+1]; arr.resize(len); }
C语言版
void _hsort(int arr[], int len) { int i,j,t; /*int *arrtmp = (int*)malloc((len+1)*sizeof(int)); for (i=0; i<len; i++) arrtmp[i+1] = arr[i];*/ int *arrtmp = arr-1; /*处理技巧:这样就不用额外内存,注意不要用arrtmp[0];*/ /* make heap */ for (i=2; i<=len; i++){ /* shift up 以保持堆性质 */ j=i,t=j/2; while (t>=1){ if (j%2 && arrtmp[j]>arrtmp[j-1]) j -= 1; if (arrtmp[t]>arrtmp[j]) swap(arrtmp[t], arrtmp[j]); j=t,t=j/2; } /*t = i/2; *while (t>=1 && arrtmp[t]>arrtmp[i]){ * swap(arrtmp[t],arrtmp[i]); * i = t, t = i/2; *} * Bug! * while循环见鬼了: * 1、去掉swap句会死循环,2、平方时间。 * gdb display t 跟踪,t值变化很吓人。 * 找3小时同时gdb display i才找到原因:i=t,t=i/2;改变了外层for的i递增。相当隐秘。 */ } /* 排序后是逆序的 */ for (i=len; i>=2; i--){ swap(arrtmp[i], arrtmp[1]); /* shif down */ j = 1, t = j*2; while(t<i-1){ if (t+1<i && arrtmp[t]>arrtmp[t+1]) t += 1; if (arrtmp[t] < arrtmp[j]) swap(arrtmp[t], arrtmp[j]); j = t, t = 2*j; } } i=1,j=len; while (i<j) { swap(arrtmp[i], arrtmp[j]); i++; j--; } /* bug!! arrtmp[i++] = arrtmp[j--]; */ /*for (i=0; i<len; i++) arr[i] = arrtmp[len-i]; free(arrtmp);*/ }
技巧
一、传入的数组指针有效下标一般是0到n-1,而堆排序要求下标是1到n。
解决方法:新建指针变量指向传入指针的前一个位置,操作新指针即可。
原来的方法:申请内存,错位复制过去,排序后复制回来。
git记录
发现_hsort函数问题
从master的某个提交checkout,然后git branch 建立分支, 再checkout到分支
在分支上修复成功后git rebase都几个分支上,出现冲突,解决,继续,因为冲突,git log显示之前的提交时间都被修改了。
所以应该用git merge比较好。