【做练习】最大上升子序列（树状数组）树状数组的原理及应用详解

程序员文章站 2022-07-13 21:23:04

...

1. 题目

总时间限制: 1000ms 内存限制: 65536kB

描述

一个数的序列bi，当b1 < b2 < … < bS的时候，我们称这个序列是上升的。对于给定的一个序列(a1, a2, …, aN)，我们可以得到一些上升的子序列(ai1, ai2, …, aiK)，这里1 <= i1 < i2 < … < iK <= N。比如，对于序列(1, 7, 3, 5, 9, 4, 8)，有它的一些上升子序列，如(1, 7), (3, 4, 8)等等。这些子序列中最长的长度是4，比如子序列(1, 3, 5, 8).

你的任务，就是对于给定的序列，求出最长上升子序列的长度。

输入

输入的第一行是序列的长度N (1 <= N <= 300000)。第二行给出序列中的N个整数，这些整数的取值范围都在0到100000000之间。

输出

最长上升子序列的长度。

样例输入

7
1 7 3 5 9 4 8

样例输出

2. 分析

这是一道经典题，我们通常立刻想到动态规划来做。但是我们本题中序列的长度很大（300000），只有1000ms，动态规划的 $O(n^2)$ 复杂度肯定会TimeOut。

2.1. 树状数组

这里介绍另一办法：树状数组，它能够将复杂度降低到 $O(n log(n))$ 。
树状数组是一种数组的特殊存储方式，它储存区间属性而不是每个元素。

2.1.1. 什么时候用树状数组？

我们假设数组的任意闭区间 $A[i:j]$ 具有属性 $P(A[i:j])$ ，并且，若我们把 $A[i:j]$ 划分为任意数量个子区间 $A[i: i_1],A[i_1:i_2],...,A[i_k: j]$ 后， $P(A[i:j])$ 总是可以由这些子区间的属性 $P(A[i: i_1]),P(A[i_1:i_2]),...,P(A[i_k:j])$ 推导得出。这时我们称这个数组对属性 $P$ 满足区间化条件（这个说法是我擅自定义的）。这时，我们就能够用树状数组（或线段树）来解决问题了。

常见的可满足区间化条件的属性有：区间求和、最值等。

2.1.2. 怎么建立树状数组？

我们设原来得到数组为 $A$ ，现在想要把它变为树状数组（记为 $C$ ），怎么做呢？为此，我们引入一个LowBit辅助函数。LowBit(x)把x除了最低非零位之外的所有位置零。换句画说，LowBit(x)计算一个尽可能大的2的幂，使得它为x的一个因数。注：假设A和C的下标均从1开始。

然后，我们用 $C[i]$ 来记录区间 $A[i-LowBit(i)+1 : i]$ 的区间属性。
以下示意图表示了一个 $C$ 和原数组区间的对应关系。
【做练习】最大上升子序列（树状数组）树状数组的原理及应用详解

2.1.3. Ask操作

$Ask(i)$ 操作查询区间 $A[1:i]$ 的属性。

我们以求和为例，此时，我们只需要把 $i$ 写为： $i=2^{k_1} + 2^{k_2}+2^{k_3}+...+2^{k_m}$ ，其中 $k_1>k_2>...>k_m$

则 $A[1:i]$ 的求和即可写为 $C[2^{k_1}]+C[2^{k_1}+2^{k_2}]+...+C[2^{k_1} + 2^{k_2}+...+2^{k_m}]$

具体如何做？其实很简单：

int Ask(i)
{
	int sum = 0;
	for(; i >= 1; i -= LowBit(i)) sum += C[i];
	return sum;
}

我们还可以通过 $Ask(N)$ 来查询整个数组的属性。这个操作是 $O(log(N))$ 的。

2.1.4 Update操作

$Update(i, value)$ 操作更新某个区间的属性，并进一步更新包含这个区间的上层区间。这个操作也是 $O(log(N))$ 的。

如果我们记 $H(x)=x+LowBit(x)$ ，我们发现，对于 $C[i]$ 所对应的区间，包含它的区间为： $C[i], C[H(i)], C[H(H(i))], C[H(H(H(i)))], ...$

同样以求和为例：

void Update(int i, int v)
{
	int delta = v - C[i];
	for(; i <= N; i += LowBit(i))
		C[i] += delta;
}

使用树状数组解决最长上升子序列

在动态规划方法中，我们记对于结尾下标为 $i$ （含）的最大上升子序列长度为 $LIS(i)$ ，它满足递推式：
$LIS(i)={max} \{ LIS(j) + 1 | j<i \wedge A[i] \leq A[j] \}$

若对序列 $LIS(1), LIS(2), ..., LIS(N)$ 求取区间最大值，是满足区间化性质的，可以使用树状数组来储存。而且我们知道， $max\ LIS[i:j]$ 表示结尾落在区间 $A[i:j]$ 的最上升子序列。

如果我们首先把输入数组 $A$ 按照以下规则重新排序，得到 $A'$ ：

数值小的更靠前
数值相等时，保持在原数组中的先后顺序

我们从左到右扫描排序后的数组 $A'$ ，当扫描到 $A'[k]$ 时，维护树状数组 $C[i]$ 为：在只考虑扫描过的数字的前提下，从开始到位置 $i$ 的最大上升子序列。

设 $A[k]$ 排序后变为 $A'[k']$ ，那么，当扫描到 $A'[k]$ 时，对于树状数组的维护，只需进行操作： $Update(k, Ask(k)+1)$ ，即可。

代码

#include <stdio.h>
#include <algorithm>
#pragma warning(disable: 4996) //make Visual Studio happy


# define max(x, y) x < y ? y : x

class MaxTreeArray
{
private:
	int* C;

	static inline int Lowbit(int x) { return x & -x; }

public:
	const int size;

	MaxTreeArray(int size) : size(size) 
	{ 
		C = new int[size + 1]; 
		for (int i = 1; i <= size; i++)
			C[i] = 0;
	}

	int Ask(int index)
	{
		int s = 0;
		for (int i = index; i >= 1; i -= Lowbit(i))
			s = max(s, C[i]);
		return s;
	}

	void Update(int index, int value)
	{
		for (int i = index; i <= size; i += Lowbit(i))
			C[i] = max(C[i], value);
	}

};


class IndexInt
{
public:
	int index;
	int val;
	IndexInt(int val = 0, int index = 0) :val(val), index(index) {}
	bool operator <(const IndexInt& other)const
	{
		return val == other.val ? index > other.index : val < other.val;
	}
};



int main()
{
	int N;
	IndexInt* arr;

	// Input and initialize
	scanf("%d", &N);
	arr = new IndexInt[N];
	MaxTreeArray treeArr = MaxTreeArray(N);
	for (int i = 0; i < N; i++) {
		int val;
		scanf("%d", &val);
		arr[i] = IndexInt(val, i + 1);
	}

	// sort
	std::sort(arr, arr + N);

	// compute LIS
	for (int i = 0; i < N; i++)
		treeArr.Update(arr[i].index, treeArr.Ask(arr[i].index) + 1);

	// output
	printf("%d", treeArr.Ask(N));

	delete[] arr;
	return 0;
}

【做练习】最大上升子序列（树状数组） 树状数组的原理及应用详解