递归函数是一种强有用的技巧,用来解决某些问题很顺手,比如前面提到的求阶乘、求菲波那契数;但是和其他技巧一样,递归函数也是有缺陷的,而且这种缺陷是致命性的。
递归函数的空间开销
在程序占用的整个内存中,有一块内存区域叫做栈(Stack),它是专门用来给函数分配内存的,每次调用函数,都会将相关数据压入栈中,包括局部变量、局部数组、形参、寄存器、冗余数据等。
栈是针对线程来说的,每个线程都拥有一个栈,如果一个程序包含了多个线程,那么它就拥有多个栈。目前我们编写的程序都是单线程的,所以不必考虑多线程的情况。
对每个线程来说,栈能使用的内存是有限的,一般是1M~8M,这在编译时就已经决定了,程序运⾏期间不能再改变。如果程序使用的栈内存超出最大值,就会发⽣栈溢出(Stack Overflow)错误。
栈内存的大小和编译器有关,编译器会为栈内存指定一个最大值,在 VC/VS 下,默认是 1M,在 C-Free 下,默认是 2M,在 Linux GCC下,默认是 8M。当然,我们也可以通过参数来修改栈内存的大小。
发生函数调⽤时会将相关数据压入栈中,函数调⽤结束会释放这⼀部分内存,对于一般的函数来说,这不会有任何问题,但是对于递归函数,这会导致严重的问题!
递归函数内部嵌套了对自身的调用,除非等到最内层的函数调用结束,否则外层的所有函数都不会调用结束。通俗地讲,外层函数被卡主了,它要等待所有的内层函数调用完成后,它自己才能调⽤完成。
每一层的递归调用都会在栈上分配一块内存,有多少层递归调用就分配多少块相似的内存,所有内存加起来的总和是相当恐怖的,很容易超过栈内存的大小限制,这个时候就会导致程序崩溃。
例如,一个递归函数需要递归 10000 次,每次需要 1KB 的内存,那么最终就需要 10MB 的内存。
为了演示由于栈溢出而导致程序崩溃的情形,下面我们⽤递归的方式来求 1+2+3+ .... + (n-1) + n 的 值 :
#include<stdio.h>
long sum(int n)
{
//为了增加每次函数调用的内存,额外增加了一个无用的数组,它占用1KB的内存
int arr[250];
if(n <= 1)
{
return n;
}
else
{
return n + sum(n-1);
}
}
int main()
{
printf("从1加到1000的值为 %ld\n", sum(1000));
return 0;
}
在 Visul Studio 下运行该程序,稍等一刻后就看到程序崩溃了,如下图所示:
这是因为,每次递归调用都需要超过1KB的内存(仅仅数组就占用了1KB内存),而要得到最终的结果需要1000次递归调用,这样一来,所有内存的总和就超过了1MB。
上面我们说过,Visual Studio默认的栈内存只有1MB,超过这个界限程序就无法运行了,只能让它崩溃。使⽤其它的编译器也许程序不会崩溃,读者可以亲自尝试。
递归函数的时间开销
每次调⽤函数都会在栈上分配内存,函数调用结束后再释放这⼀部分内存,内存的分配和释放都是需要时间的。
每次调用函数还会多次修改寄存器的值,函数调用结束后还需要找到上层函数的位置再继续执行,这也是需要时间的。 所有的这些时间加在⼀起是⾮常恐怖的。
下面我们以「求斐波那契数」为例来演示双层递归的时间开销
#include<stdio.h>
#include<time.h>
//递归计算斐波那契数
long fib(int n)
{
if(n <=2)
{
return l;
}
else
{
return fib(n -1) + fib(n -2);
}
}
int main()
{
int a;
clock_t time_start, time_end;
printf("Input a number:");
scanf("%d", &a);
time_start =clock();
printf("Fib(%d) = %ld\n", a, fib(a));
time_end =clock();
printf("run time:%lfs\n", (double)(time_end - time_start)/CLOCKS_PER_SEC);
return 0;
}
运行结果:
Input a number: 42↙ Fib(42) = 267914296
run time: 13.137000s
可以看到,为了求 42 的斐波那契数程序竟然运行了 13 秒,简直让人发指。
使用迭代来替换递归函数
既然递归函数的解决⽅案存在巨⼤的内存开销和时间开销,那么我们如何进行优化呢? 其实,大部分能⽤递归解决的问题也能用迭代来解决。所谓迭代,就是循环。
许多问题是以递归的形式进⾏解释的,这只是因为它比非递归形式更为清晰。但是,这些问题的迭代实现往往⽐递归实现效率更高,虽然代 码的可读性可能稍差一些。
与递归函数相比,迭代不但没有额外的内存开销,也没有额外的时间开销。下面我们分别用递归和迭代的方案来求斐波那契数,看看它们究竟孰快孰慢
#include<stdio.h>
#include<time.h>
//递归计算斐波那契数
long fib_recursion(int n)
{
if(n <=2)
{
return 1;
}
else
{
return fib_recursion(n -1) + fib_recursion(n - 2);
}
}
//迭代计算斐波那契数
long fib_iteration(int n)
{
long result;
long previous_result;
long next_older_result;
result =previous_result =1;
whild(n > 2)
{
n -=1;
next_older_result =previous_result;
previous_result =result;
result =previous_result + next_older_result;
}
return result;
}
int main()
{
int a;
clock_t time_start_recursion, time_end_recursion;
clock_t time_start_iteration, time_end_iteration;
printf("Input a number:");
scanf("%d", &a);
//递归的时间
time_start_recursion =clock();
printf("Fib_recursion(%d) = %ld\n", a, fib_recursion(a));
time_end_recursion =clock();
printf("run time with recursion: %lfs\n", (double)(time_end_recursion - time_start_recursion)/CLOCKS_PER_SEC);
//迭代时间
time_start_iteration =clock();
printf("Fib_iteration(%d) =%ld\n", a, fib_iteration(a));
time_end_iteration =clock();
printf("run time with iteration: %lfs\n", (double)(time_end_iteration - time_start_iteration)/CLOCKS_PER_SEC);
return 0;
}
运行结果:
Input a number: 42↙ Fib_recursion(42) = 267914296 run time with recursion: 13.173000s Fib_iteration(42) = 267914296
run time with iteration: 0.000000s
你看,递归用了 13 秒,迭代几乎瞬间完成(接近0秒),迭代比递归快成千上万倍,这个差异是巨大的。
总结
函数调用本来就存在内存开销和时间开销,递归一次这种开销就增加一倍,如果有成千上万次的递归,那么所有开销的总和就是巨大的。这是递归的致命缺陷,无法优化。所以建议⼤家尽量少用递归,能用迭代就用迭代吧。