0%

算法复杂度的理解

1.复杂度分析

算法本质上是一连串的计算步骤。对于同一个问题,我们可以使用不同的算法来获得相同的结果,可是在计算过程中电脑消耗的时间和资源却有很大的区别。那我们如何来比较不同算法之间的优劣性呢?目前分析算法主要从「时间」和「空间」两个维度来进行分析。

  • 时间维度顾名思义就是算法需要消耗的时间,「时间复杂度」是常用的分析单位。

  • 空间维度代表算法需要占用的内存空间,我们通常用「空间复杂度」来分析。

1.1 时间复杂度

大O符号表示法,既 T(n) = O(f(n)),它表示一个算法的渐进时间复杂度。其中 f(n) 表示代码执行次数之和,O表示正比例关系。我们来看一个例子:

1
2
3
for (int i = 1; i <= n; i++) {
x++;
}

每个算法需要多少的运行时间呢?我们知道这个for loop有n个循环,假设其中 x++ 计算的消耗是一个单位,那么第一次循环是1单位,第二次循环是2单位,所以整个循环语句就要消耗n个单位。可以发现,消耗的单位时间随着循环的次数而变化,循环次数为1,时间为1单位;循环次数为10,时间为10单位;循环次数为n,时间为n单位。所以这个算法的「时间复杂度」可以表示为:T (n) = O(n)。

有人可能不同意了,因为严格计算下,int i = 1也要消耗1单位时间,i <= n和i++也都需要1单位时间,所以严格来说总时间是 T(n) = 1 + 3n。但是我们依然会简化为n,因为「大O表示法」用与表示计算的增长变化趋势。

在这个例子中,如果n无限大的时候,T(n) = 1 + 3n 中的常数1就没有意义了,倍数3也影响不大。所以简化为 T(n) = O(n) 就可以 了。

我们再来看一个例子:

1
2
3
4
5
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= n; j++) {
x++;
}
}

在外层循环中,i 总共需要n层循环,在每一次内层循环中,j 也会循环n次。如果用「大O表示法」来计算,那么两个循环语句的复杂度就是 O(n²),如果我们将这两个算法合并到一起:

1
2
3
4
5
6
7
8
for (int i = 1; i <= n; i++) {
x++;
}
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= n; j++) {
x++;
}
}

整个算法复杂度就变为 O(n + n²),在n无限大的情况下,可以简化为 O(n²)。

1.2 常用的时间复杂度量级

1

  • 常数阶O(1)
  • 对数阶O(logN)
  • 线性阶O(n)
  • 线性对数阶O(nlogN)
  • 平方阶O(n²)
  • 立方阶O(n³)
  • K次方阶O(n^k)
  • 指数阶(2^n)
  • 阶乘O(n!)

上面的时间复杂从上到下复杂度越来越大,也意味着执行效率越来越低。

  1. 常数阶O(1)

只要没有循环或递归等复杂逻辑,无论代码执行多少行,代码复杂度都为O(1),如下:

1
2
3
4
5
int x = 0;
int y = 1;
int temp = x;
x = y;
y = temp;

上述代码在执行的时候,所消耗的时间不会随着特定变量的增长而增长,即使有几万行这样的代码,我们都可以用O(1)来表示它的时间复杂度。

2.线性阶O(n)

我们在上述的例子中讲解过O(n)的算法:

1
2
3
for (int i = 1; i <= n; i++) {
x++;
}

在这段代码中,for循环会执行n遍,因此计算消耗的时间是随着n的变化而变化,因此这类代码都可以用O(n)来表示其时间复杂度。

3.对数阶O(logN)

来看以下的例子:

1
2
3
4
int i = 1;
while(i < n) {
i = i * 2;
}

在上面的循环中,每次i都会被乘以2,也意味着每次 i 都离 n 更进一步。那需要多少次循环 i 才能等于或大于 n 呢,也就是求解2的x次方等于n,答案x=log2^n。也就是说循环 log2^n次之后,i会大于等于n,这段代码就结束了。所以此代码的复杂度为:O(logN)。

4.线性对数阶O(nlogN)

线性对数阶O(nlogN)很好理解,也就是将复杂度为O(logN)的代码循环n遍:

1
2
3
4
5
6
for(int i = 0; i <= n: i++) {
int x = 1;
while(x < n) {
x = x * 2;
}
}

因为每次循环的复杂度为O(logN),所以n * logN = O(nlogN)

5.平方阶O(n²)

在之前的例子我们也讲过,O(n²)就是将循环次数为n的代码再循环n遍:

1
2
3
4
5
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= n; j++) {
x++;
}
}

O(n²)的本质就是n * n,如果我们将内层的循环次数改为m:

1
2
3
4
5
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= m; j++) {
x++;
}
}

复杂度就变为 n * m = O(n * m)。

关于一些更高的阶级比如O(n³)或者O(n^k),我们可以参考O(n²)来理解即可,O(n³)相当于三层循环,以此类推。

除了「大O表示法」还有其他「平均时间复杂度」、「均摊时间复杂度」、「最坏时间复杂度」、「最好时间复杂度」等等分析指数,但是最常用的依然是「大O表示法」。

1.3 空间复杂度

既然「时间复杂度」不是计算程序具体消耗的时间,「空间复杂度」也不是用来计算程序具体占用的空间。随着问题量级的变大,程序需要分配的内存空间也可能会变得更多,而「空间复杂度」反映的则是内存空间增长的趋势。

1.4 常用的空间复杂度

比较常用的空间复杂度有:O(1)、O(n)、O(n²)。在下面的例子中,我们用 S(n) 来定义「空间复杂度」。

  1. O(1)空间复杂度

如果算法执行所需要的临时空间不随着某个变量n的大小而变化,此算法空间复杂度为一个常量,可表示为 O(1):

1
2
3
4
int x = 0;
int y = 0;
x++;
y++;

其中x, y所分配的空间不随着处理数据量变化,因此「空间复杂度」为 O(1)

  1. O(n)空间复杂度

以下的代码给长度为n的数组赋值:

1
2
3
4
int[] newArray = new int[n];
for (int i = 0; i < n; i++) {
newArray[i] = i;
}

在这段代码中,我们创建了一个长度为 n 的数组,然后在循环中为其中的元素赋值。因此,这段代码的「空间复杂度」取决于 newArray 的长度,也就是 n,所以 S(n) = O(n)。

2. 算法复杂度速查表

2.1 抽象数据结构的操作复杂度

1

2.2 数组排序

1

冒泡、选择、插入 排序需要两个for循环,每次只关注一个元素,平均时间复杂度为O(n²))(一遍找元素O(n),一遍找位置O(n))

快速、归并、希尔、堆基于二分思想,log以2为底,平均时间复杂度为O(nlogn)(一遍找元素O(n),一遍找位置O(logn))

2.3 堆

  • 建堆的时间复杂度是O(n);
  • 堆的插入、删除元素的时间复杂度都是O(log n);
  • 堆排序的时间复杂度是O(nlog n);
  • 堆排序的空间复杂度是O(1);

3. 参考资料

给作者打赏,可以加首页微信,咨询作者相关问题!