阿杜Blogger: 一种特殊的排序算法 II

一种特殊的排序算法 II

-- 计数排序(Counting sort)

后续想找时间再写一篇《一种特殊的排序算法 II》，关于计数排序☺。（引自《一种特殊的排序算法 I》）

所以，继上篇文章《一种特殊的排序算法 I》，在此就（继续）描述，总结另一种特殊的排序算法，计数排序。算法的步骤如下：

找出待排序的数组中最大和最小的元素
统计数组中每个值为i的元素出现的次数，存入数组C的第i项
对所有的计数累加（从C中的第一个元素开始，每一项和前一项相加）
反向填充目标数组：将每个元素i放在新数组的第C(i)项，每放一个元素就将C(i)减去1

引用自维基内容，完整介绍可以参见计数排序（维基）。

（后面，开始分享我的内容）

关于计数排序（算法），可以划分两种具体的计数法，如下：

* 比较计数法

* 分布计数法

===

> 比较计数法

算法 ComparisonCountingSort(A[0 ... n-1])

// 用比较计数法对数组排序

// 输入:可排序数组 A[0 ... n-1]

// 输出:将A中元素按照升序排列的数组 S[0 ... n-1]

for i : 0 to n-1 do

Count[i] = 0;

for i : 0 to n-2 do

for j : i+1 to n-1 do

if A[i] < A[j]

Count[j] += 1;

else

Count[i] += 1;

for i : 0 to n-1 do

S[Count[i]] = A[i];

return S;

该算法的时间效率如何？答案为O(n^2)。因为该书法执行的键值比较次数和选择排序一样多，并且还占用了线性数量的额外空间，我们几乎不能推荐它来实际的应用。但是计数思想在一种情况下还是卓有成效的，在这种情况下，待排序的元素的值都来自于一个已知的小集合，这就是下面要描述的另一种计数排序算法，分布计算法。

===

> 分布计数法

算法 DistributionCountingSort(A[0 ... n-1, l, u])

// 用分布计数法对数组排序,对来自于有限范围整数的一个数组进行排序

// 输入:可排序数组 A[0 ... n-1],数组中的整数位于l和u之间( l <= u)

// 输出:将A中元素按照升序排列的数组 S[0 ... n-1]

for i : 0 to u-l do

D[i] = 0; // 初始化频率数组

for i : 0 to n-1 do

D[A[i] - l] = D[A[i] - l] + 1; // 计算频率值

for i : 1 to u-l do

D[i] = D[i-1] + D[i]; // 重用于分布值

for i : n-1 downto 0 do

j = A[i] - l;

S[D[j] - 1] = A[i]; // D[j] - 1]为对应的数组下标

D[j] -= 1;

return S;

注：频率值，表示元素出现的次数；分布值表示在最后有序数组中，元素最后一次出现的位置。

假设数组值的范围是固定的，这显然是一个线性效率的算法，因为它仅仅对输入数组A从头到尾连续处理两遍，其时间复杂度 O(n)。然而，要重点记忆的是，除了空间换时间之外，分布计数排序这种高效率是因为利用了输入列表独特的自然属性。

===

附：

文章内容乃学习心得（笔记），亦包括引用自《算法设计与分析基础（第2版）》内容（第七章时空权衡，7.1计数排序）。

以上描述的算法，以C\C++完成了简单的实现，示例代码参见 github。

(完）

阿杜Blogger

2012年6月28日星期四

一种特殊的排序算法 II

没有评论:

发表评论