当你运行一个程序时会有多种原因使它挂起,这些原因可以分为以下4种基本类型:
(1)程序中有死循环;
(2)程序运行的时间比所期望的长;
(3)程序在等待某些输入信息,并且直到输入正确后才会继续运行;
(4)程序设计的目的就是为了延迟一段时间,或者暂停执行。
在讨论了因未知原因而挂起的程序的调试技巧后,将逐个分析上述的每种情况。
调试那些因未知原因而挂起的程序是非常困难的。你可能花费了很长的时间编写一个程序,并努力确保每条代码都准确无误,你也可能只是在一个原来运行良好的程序上作了一个很小的修改,然而,当你运行程序时屏幕上却什么也没有显示。如果你能得到一个错误的结果,或者部分结果,你也许知道应该作些什么修改,而一个空白的屏幕实在令人沮丧,你根本不知道错在哪里。
在开始调试这样一个程序时,你应该先检查一下程序结构,然后再按执行顺序依次查看程序的各个部分,看看它们是否能正确运行。例如,如果主程序只包含3个函数调用——A()、B()和C(),那么在调试时,你可以先检查函数A()是否把控制权返回给了主程序。为此,你可以在调用函数A()的语句后面加上exit()命令,也可以用注释符把对函数B()和C()的调用括起来,然后重新编译并运行这个程序。
注意:通过调试程序(debugger)也可以做到这一点,然而上述方法是一种很传统的调试方法。调试程序是一个程序,它的作用是让程序员能够观察程序的运行情况、程序的当前运行行号、变量的值,等等。
此时你将看到函数A()是否将控制权返回给了主程序——如果该程序运行并退出,你可以判断是程序的其它部分使程序挂起。你可以用这种方法测试程序的每一部分,直到发现使程序挂起的那一部分,然后集中精力修改相应的函数。
有时,情况会更复杂一些。例如,使程序挂起的函数本身是完全正常的,问题可能出在该函数从别的地方得到了一些错误的数据。这时,你就要检查该函数所接受的所有的值,并找出是哪些值导致了错误操作。
技巧:监视函数是调试程序的出色功能之一。
分析下面这个简单的例子将帮助你掌握这种技巧的使用方法:
#include <stdio. h>
#include <stdlib. h>
/*
* Declare the functions that the main function is using
*/
int A(), B(int), C(int, int);
/*
* The main program
*/
int A(), B(), C(); /*These are functions in some other module */
int main()
{
int v1, v2, v3;
v1 = A();
v2 = B(v1);
v3 = C(v1, v2);
printf ("The Result is %d. \n" , v3);
return(0) ;
}
你可以在调用函数A()的语句后输出变量v1的值,以确认它是否在函数B()所能接受的值的范围之内,因为即使是函数B()使程序挂起,它本身并不一定就有错,而可能是因为函数A()给了函数B()一个并非它所期望的值。现在,已经分析了调试“挂起”的程序的基本方法,下面来看看一些使程序挂起的常见错误。
当你的程序出现了死循环时,机器将无数次地执行同一段代码,这种操作当然是程序员所不希望的。出现死循环的原因是程序员使程序进行循环的判断条件永远为真,或者使程序退出循环的判断条件永远为假。下面是一个死循环的例子:
/* initialize a double dimension array */
for (a = 0 ; a < 10; ++a )
{
for(b = 0; b<10; ++a)
{
array[a][b]==0;
}
}
这里的问题是程序员犯了一个错误(事实上可能是键入字母的错误),第二个循环本应在变量b增加到10后结束,但是却从未让变量b的值增加!第二个for循环的第三部分增加变量a的值,而程序员的本意是要增加变量b的值。因为b的值将总是小于10,所以第二个for循环会一直运行下去。
怎样才能发现这个错误呢?除非你重新阅读该程序并注意到变量b的值没有增加,否则你不可能发现这个错误。当你试图调试该程序时,你可以在第二个for循环的循环体中加入这样一条语句:
printf(" %d %d %d/n" , a , b , array[a][b]) ;
这条语句的正确输出应该是:
0 0 0
0 1 0
(and eventually reaching)
9 9 0
但你实际上看到的输出却是:
0 0 0
1 0 0
2 0 0
...
你所得到是一个数字序列,它的第一项不断增加,但它本身永远不会结束。用这种方法输出变量不仅可以找出错误,而且还能知道数组是否由所期望的值组成。这个错误用其它方法似乎很难发现!这种输出变量内容的技巧以后还会用到。
产生死循环的其它原因还有一些其它的原因也会导致死循环。请看下述程序段:
int main()
{
int a = 7;
while ( a < 10)
{
+ +a;
a /= 2;
}
return (0);
}
尽管每次循环中变量a的值都要增加,但与此同时它又被减小了一半。变量a的初始值为7,它先增加到8,然后减半到4。因此,变量a永远也不会增加到10,循环也永远不会结束。
在有些情况下,你会发现程序并没有被完全“锁死”,只不过它的运行时间比你所期望的时间长,这种情况是令人讨厌的。如果你所使用的计算机运算速度很快,能在极短的时间内完成很复杂的运算,那么这种情况就更令人讨厌了。下面举几个这样的例子:
/*
* A subroutine to calculate Fibonacci numbers
*/
int fib ( int i)
{
if (i <3)
return 1;
else
return fib( i - 1)+fib( i - 2);
}
一个菲波那契(Fibonacci)数是这样生成的:任意一个菲波那契数都是在它之前的两个菲波那契数之和;第一个和第二个菲波那契数是例外,它们都被定义为1。菲波那契数在数学中很有意思,而且在实际中也有许多应用。
注意:在向日葵的种子中可以找到菲波那契数的例子——向日葵有两组螺旋形排列的种子,一组含21颗种子,另一组含34颗种子,这两个数恰好都是菲波那契数。
从表面上看,上述程序段是定义菲波那契数的一种很简单的方法。这段程序简洁短小,看上去执行时间不会太长。但事实上,哪怕是用计算机计算出较小的菲波那契数,例如第100个,都会花去很长的时间,下文中将分析其中的原因。
如果你要计算第40个菲波那契数的值,就要把第39个和第38个菲波那契数的值相加,因此需要先计算出这两个数,而为此又要分别计算出另外两组更小的菲波那契数的和。不难看出,第一步是2个子问题,第二步是4个子问题,第三步是8个子问题,如此继续下去,结果是子问题的数目以步数为指数不断增长。例如,在计算第40个菲波那契数的过程中,函数fib()将被调用2亿多次!即便在一台速度相当快的计算机上,这一过程也要持续好几分钟。
数字的排序所花的时间有时也会超出你的预料:
/*
* Routine to sort an array of integers.
* Takes two parameters:
* ar---The array of numbers to be sorted, and
* size---the size of the array.
*/
void sort( int ar[], int size )
{
int i,j;
for( i = 0; i<size - 1; ++ i)
{
for( j = 0; j< size - 1; ++j )
{
if (ar[j]>ar[j + 1])
{
int temp;
temp = ar[j];
ar[j] = ar[j + 1];
ar[j + 1] = temp;
}
}
}
}
如果你用几个较短的数列去检验上述程序段,你会感到十分满意,因为这段程序能很快地将较短的数列排好序。如果你用一个很长的数列来检验这段程序,那么程序看上去就停滞了,因为程序需要执行很长时间。为什么会这样呢?
为了回答上述问题,先来看看嵌套的for循环。这里有两重for循环,其中一个循环嵌套在另一个循环中。这两个循环的循环变量都是从O到size-1,也就是说,处于两重循环之间的程序段将被执行size*size次,即size的平方次。对含10个数据项的数列进行排序时,这段程序还是令人满意的,因为10的平方只有100。但是,当你对含5000个数据项的数列进行排序时,循环中的那段程序将被执行2500万次;当你对含100万个数据项的数列进行排序时,循环中的那段程序将被执行1万亿次。
在上述这些情况下,你应该比较准确地估计程序的工作量。这种估计属于算法分析的范畴,掌握它对每个程序员来说都是很重要的。
有时程序停止运行是因为它在等待正确的输入信息。最简单的情况就是程序在等待用户输入信息,而程序却没有输出相应的提示信息,因而用户不知道要输入信息,程序看上去就好象锁住了。更令人讨厌的是由输出缓冲造成的这种结果,这个问题将在17.1中深入讨论。
请看下述程序段:
/*
*This program reads all the numbers from a file.
* sums them, and prints them.
*/
# include <stdio. h>
main()
{
FILE *in = fopen("numbers.dat", "r");
int total = 0, n;
while( fscanf( in, " %d" , &n )! =EOF)
{
total + = n;
}
printf( "The total is %d\n" , total);
fclose ( in ) ;
}
如果文件NUMBERS.DAT中只包含整数,这段程序会正常运行。但是,如果该文件中包含有效整数以外的数据,那么这段程序的运行结果将是令人惊奇的。当该程序遇到一个不恰当的值时,它会发现这不是一个整数值,所以它不会读入这个值,而是返回一个错误代码。但此时程序并未读到文件尾部,因此与EOF比较的值为假。这样,循环将继续进行,而n将取某个未定义的值,程序会试图再次读文件,而这一次又遇到了刚才那个错误数据。请记住,因为数据不正确,所以程序并不读入该数据。这样,程序就会无休止地执行下去,并一直试图读入那个错误的数据。解决这个问题的办法是让while循环去测试读入的数据是否正确。
还有许多其它原因会使程序挂起,但总的来说,它们都属于上述三种类型中的某一种。