代码千千万,有些代码逻辑会很复杂,所以为了更细化的分析算法的复杂度,再复杂度分析方面引入了4个知识点:
1.最好情况时间复杂度(best case time complexity)。
2.最坏情况时间复杂度(worst case time complexity)。
3.平均情况时间复杂度(average case time complexity)。
4.均摊时间复杂度(amortized time complexity)。
示例如下(限定条件:0<n且0<x且n和x为整数):
- public int Function(int n, int x)
- {
- int sum = 0;
- for (int i = 1; i <= n; ++i)
- {
- if (i == x)
- break;
- sum += i;
- }
- return sum;
- }
这段代码逻辑非常简单,再此不描述。需要重点分析的是循环这一段代码,这段代码根据x值的不同,时间复杂度也有区别:
1.当x>n时,此代码的时间复杂度是O(n)。
2.当1<=x<=n时,时间复杂度是一个我们不确定的值,取决于x的值。
3.当x=1时,时间复杂度是O(1)。
这段代码在不同情况下,其时间复杂度是不一样的。所以为了描述代码在不同情况下的不同时间复杂度,我们引入了最好、最坏、平均时间复杂度。
最好情况时间复杂度,表示在最理想的情况下,执行这段代码的时间复杂度。
上述示例就是当x=1的时候,循环的第一个判断就跳出,这个时候对应的时间复杂度就是最好情况时间复杂度。
最坏情况时间复杂度,表示在最糟糕的情况下,执行这段代码的时间复杂度。
上述示例就是n<x的时候,我们要把整个循环执行一遍,这个时候对应的时间复杂度就是最坏情况时间复杂度。
最好和最好情况是极端情况,发生的概率并不大。为了更有效的表示平均情况下的时间复杂度,引入另一个概念:平均情况时间复杂度。
分析上面的示例代码,判断x在循环中出现的位置,有n+1种情况:1<=x<=n 和n<x。
我们将所有情况下代码执行的次数累加起来((1+2+3....+n)+n),然后再除以所有情况数量(n+1),就可以得到需要遍历次数的平均值。
平均情况复杂度为:
((1+2+3...+n)+n)(n+1)=n(n+3)2(n+1)
推导过程:
∵1+2+3...+n=n+(n−1)+(n−2)...+1
∴(1+2+3...+n)=n(1+n)2
∴(1+2+3...+n)+n=n(3+n)2
大O表示法,会省略系数、低阶、常量,所以平均情况时间复杂度是O(n)。
但是这个平均复杂度没有考虑各自情况的发生概率,这里的n+1个情况,它们的发生概率是不一样的,所以还需要引入各自情况发生的概率再具体分析。
x要么在1~n中,要么不在1~n中,所以它们的概率都是12。
同时数据在1~n中各个位置的概率都是一样的为1n。根据概率乘法法则,x在1~n中任意位置的概率是12n。
因此在前面推导过程的基础上,我们把每种情况发生的概率考虑进去,那么平均情况时间复杂度的计算过程变成:
考虑概率的平均情况复杂度为:
(112n+212n+312n...+n12n)+n12=3n+14
推导过程:
∵(1+2+3...+n)=n(1+n)2
∴(112n+212n+312n...+n12n)=12n(1+2+3...+n)=12n∗n(1+n)2=1+n4
∴(112n+212n+312n...+n12n)+n12=1+n4+n12=3n+14
这就是概率论中的加权平均值,也叫做期望值,所以平均时间复杂度全称叫:加权平均时间复杂度或者期望时间复杂度。
引入概率之后,平均复杂度变为O(3n+14),忽略系数及常量后,最终得到加权平均时间复杂度为O(n)。
注意:
多数情况下,我们不需要区分最好、最坏、平均情况时间复杂度。只有同一块代码在不同情况下时间复杂度有量级差距,我们才会区分3种情况,为的是更有效的描述代码的时间复杂度。
均摊复杂度是一个更加高级的概念,它是一种特殊的情况,应用的场景也更加特殊和有限。
对应的分析方式称为:摊还分析或平摊分析。
示例如下(限定条件:0<=x<=n且0<=n且n,x为整数):
- int n;
- int Function2(int x)
- {
- int count = 0;
- if (n == x)
- {
- for (int i = 0; i < n; i++)
- {
- count += i;
- }
- }
- else
- count = x;
- return count;
- }
分析上述案例的时间复杂度:
最理想情况下x!=n,只执行一次赋值即可推出,所以最好时间复杂度为O(1)。
最坏的情况下x=n,要执行一次循环累加和的操作,所以最好时间复杂度为O(n)。
平均的情况下,因为限定条件0<=x<=n,x在0~n中存在的位置可以分为n+1种情况(0到n)。
当0<=x<n时,时间复杂度为O(1)。但是x=n的时候是一个例外,它的复杂度是O(n)。
而且这n+1种情况发生的概率都是一样的,为1n+1。所以根据加权平均的计算方法,
平均时间复杂度为:
(11n+1+11n+1+11n+1+...+11n+1)+n1n+1=2nn+1
推导过程:
(11n+1+11n+1+11n+1+...+11n+1)+n1n+1
=n1n+1+n1n+1
=2nn+1
当省略系数及常量后,平均时间复杂度为O(1)。
摊还分析法
分析上述示例的平均复杂度分析并不需要如此复杂,无需引入概率论的知识。
因为通过分析可以看出,上述示例代码复杂度大多数为O(1),极端情况下复杂度才较高为O(n)。同时复杂度遵循一定的规律,一般为1个O(n),和n个O(1)。针对这样一种特殊场景使用更简单的分析方法:摊还分析法。
通过摊还分析法得到的时间复杂度为均摊时间复杂度。
大致思路:每一次O(n)都会跟着n次O(1),所以把耗时多的复杂度均摊到耗时低的复杂度。得到的均摊时间复杂度为O(1)。
应用场景:均摊时间复杂度和摊还分析应用场景较为特殊,对一个数据进行连续操作,大部分情况下时间复杂度都很低,只有个别情况下时间复杂度较高。而这组操作其存在前后连贯的时序关系。
这个时候我们将这一组操作放在一起分析,将高复杂度均摊到其余低复杂度上,所以一般均摊时间复杂度就等于最好情况时间复杂度。
注意:均摊时间复杂度是一种特殊的平均复杂度(特殊应用场景下使用),掌握分析方式即可。