分治策略——算法导论(3)

1. 从一个股价的问题说起

假如你获得了一种可以预测未来某公司股价的能力。下图是你预测的股价情况，那么你会在哪一天买入，哪一天卖出呢？

你可能认为可以在这17天当中的股价最低的那天（第7天）买入，然后在之后的股价最高的那天（第11天）卖出；或者反过来在整段时间内股价最高的那天卖出，然后在之前的股价最低的那天买入。如果这种策略是可行的，那么确定最大收益将非常简单。但这种策略不是经常奏效的。比如下图的这种情况：

很容易看出在第2天买入，第3天卖出，将获得最大的收益。但第二天并非最低（事实上股价最低是第4天），第3天也并非股价最高（股价最高是第1天）。

2. 暴力方法(穷举法 Exhaustive method)求解

我们最容易想到的方法应该是暴力求解方法（事实上在条件允许的时候，暴力破解方法不失为是一种好方法）。分析该方法可发现，n天中我们需要尝试的组合将有种，而处理每对日期的时间至少是常量时间，因此，这种方法的运行时间是θ(n2)。下面给出这种算法的Java实现代码：

public static void main(String[] args) {
	int[] priceArray = new int[] { //
			100, 113, 110, 85, //
			105, 102, 86, 63, //
			81, 101, 94, 106, //
			101, 79, 94, 90, //
			97 };
	int maxDifference = Integer.MIN_VALUE;
	int startDay = -1;
	int endDay = -1;
	for (int i = 0; i < priceArray.length; i++) {
		int startPrice = priceArray[i];
		for (int j = i + 1; j < priceArray.length; j++) {
			int endPrice = priceArray[j];
			int difference = endPrice - startPrice;
			if (difference > maxDifference) {
				maxDifference = difference;
				startDay = i;
				endDay = j;
			}
		}
	}
	System.out.println("第" + startDay + "天买入,第" + endDay + "天卖出可获得最大差价：" + maxDifference);
}

运行结果：第7天买入,第11天卖出可获得最大差价：43

3. 最大子数组问题

穷举法(Exhaustive method)虽简单，但往往不是最优方法。那有没有更好的方法呢？

我们从一个稍微不同的角度来看待输入的数据。我们的目的是寻找一段时间，使得第一天到最后一天的股价净变化最大。因此我们不再从每日价格的角度去看待输入的数据，而是考察每日价格的变化。如果把每日价格的变化集合到数组array，如下图，那么该问题就变成了：在array中找出一个子数组（即最大子数组），使得子数组的所有元素之和最大。

乍一看，这种问题的转化并没有给我们带来什么好处。如果采用暴力破解方法对于一段n天的时间，我们仍然要检查次，运算时间仍为θ(n2)。

接下来，我们寻找求最大子数组的更高效方法。需要提前说明的是，最大子数组有些时候可能有多个；只有当数组内包含负元素时，讨论最大子数组问题才有意义，因为对于非负数组，整个数组必然是最大子数组。

4. 采用分治法(Divide and Conquer)求解最大子数组

在第一篇中我们已经接触过分治策略，它需要考虑以下三步：

① 分解：分解意味着我们要将数组分为两个规模尽量相等的子数组。也就是说，如果数组a[low~high]为将要求解的数组，我们要将a[low~high]分为a1[low~mid]，a2[mid~high]，其中mid = (high – low) / 2。

② 解决：解决意味着我们要递归的解决子数组的求解。这里需要注意的是，最大子数组所处的位置可能有以下三种情况：在a1中；在a2中；跨越中点。

③ 合并：通过比较以上三种情况求出的最大子数组，得出真正的最大子数组。

下面给出分治法(Divide and Conquer)的Java实现代码：

/**
 * 分治法
 *
 * @param args
 */
public static void main(String[] args) {
	int[] differenceArray = new int[] { //
			13, -3, -25, -20, //
			-3, -16, -23, 18, //
			20, -7, 12, -5, //
			-22, 15, -4, 7, //
	};
	Result result = findMaxSubarray(differenceArray, 0, differenceArray.length - 1);
	System.out.println("第" + result.startDay + "天买入,第" + result.endDay + "天卖出可获得最大差价：" + result.maxDifference);
}

/**
 * 找出最大子数组
 *
 * @param array
 * @return
 */
private static Result findMaxSubarray(int array[], int low, int high) {
	if (low == high) {
		Result result = new Result();
		result.startDay = low;
		result.endDay = low;
		result.maxDifference = array[low];
		return result;
	} else {
		Result leftResult = findMaxSubarray(array, low, (high + low) / 2);
		Result rightResult = findMaxSubarray(array, (high + low) / 2 + 1, high);
		Result crossingMiddleResult = findMaxSubarrayCrossingMiddle(array, low, high);
		int maxDifference = Math.max(Math.max(leftResult.maxDifference, rightResult.maxDifference),
				crossingMiddleResult.maxDifference);
		if (maxDifference == leftResult.maxDifference) {
			return leftResult;
		} else if (maxDifference == rightResult.maxDifference) {
			return rightResult;
		} else {
			return crossingMiddleResult;
		}
	}
}

/**
 * 找出跨越中点的最大子数组
 *
 */
private static Result findMaxSubarrayCrossingMiddle(int[] array, int low, int high) {
	Result result = new Result();
	int maxLeftSum = Integer.MIN_VALUE;
	int maxRightSum = Integer.MIN_VALUE;
	int sum = 0;
	int mid = (high + low) / 2;
	for (int i = mid; i >= 0; i--) {
		sum += array[i];
		if (sum > maxLeftSum) {
			maxLeftSum = sum;
			result.startDay = i;
		}
	}
	sum = 0;
	for (int i = mid; i < array.length; i++) {
		sum += array[i];
		if (sum > maxRightSum) {
			maxRightSum = sum;
			result.endDay = i;
		}
	}
	result.maxDifference = maxLeftSum + maxRightSum;
	return result;
}

static class Result {
	public int startDay;
	public int endDay;
	public int maxDifference;
}

结果为：第7天买入,第11天卖出，可获得最大差价：43

下面我们建立一个递归式来描述递归过程的运算时间。

① 对于low = high的基本情况(base case)，花费常量时间θ(1)。

② 对于low ≠ hight的递归情况(recursive case)，两次递归花费2T(n / 2)时间，findMaxSubarrayCrossingMiddle方法花费时间θ(n)，其余花费常量时间θ(1)，因此一共花费2T(n / 2) + θ(1)。即：

解得T(n) = θ(nlgn)。在n较大时，该方法将打败穷举法(Exhaustive method)。

5. 另一种时间为线性的方法

我们考虑这么一种方法：从数组的最左边开始向右扩展，记录扩展过程中的最大子数组。若已知array[0~j]的最大子数组，基于如下方法将解扩展为array[0~j+1]的最大子数组：array[0~j+1]的最大子数组要么是array[0~j]的最大子数组，要么是array[i~j+1]（0≤i≤j+1）。在已知array[0~j]的最大子数组的情况下，可以在线性时间内找出形如array[i~j+1]的最大子数组。

ps：以上内容均摘自《算法导论》中文译本。本人只是提取出文中个人认为比较重要的点加入了一些个人理解仅供参考。

时间： 2024-10-26 08:35:21

分治策略——算法导论(3)

分治策略——算法导论(3)的相关文章

（学习6）特殊的分治策略算法——BFPTR

算法导论第四章分治策略编程实践（二）

分治策略(2)——算法导论(4)

算法导论第四章分治策略

【经典算法】分治策略

【从零学习经典算法系列】分治策略实例——快速排序（QuickSort）

【从零学习经典算法系列】分治策略实例——二分查找

第四章分治策略 4.1 最大子数组问题（暴力求解算法）

算法导论三剑客之分治算法合并排序