算法的定义及运行效率-一一网

这是我参与更文挑战的第19天，活动详情查看：更文挑战

定义

解决特定问题求解步骤的描述

指令的有限序列, 每条指令表示一个或多个操作

五大基本特性

输入 – 算法具有0个或多个输入

输出 – 算法至少有1个或多个输出

有穷性 – 算法在执行有限的步骤之后, 自动结束而不会出现无限循环, 并且每一个步骤在可接受的时间内完成

确定性 – 算法的每一步骤都具有确定的含义, 不会出现二义性

可行性 – 算法的每一步都能够通过执行有限次数完成

五大设计要求

正确性 – 能正确反映问题的需求, 能得到问题的正确答案

分为4个层次:

没有语法错误

对于合法的输入数据能够产生满足要求的输出结果

对于非法的输出数据能够得出满足规格说明的结果

对于刁难的测试数据能有满足要求的输出结果

可读性 – 便于阅读, 理解和交流

健壮性 – 当输入数据不合法时, 算法也能做出相关处理

时间效率高 – 算法的执行时间短

存储量低 – 算法在执行过程中需要的最大存储空间低

花最少的钱, 用最短的时间, 办成同样的事

算法效率的度量方法

算法效率 – 算法的执行时间

事后统计方法 – 利用计算机计时器对不同算法编制的程序的运行时间来进行比较

缺点:

依据算法事先编制好程序, 花费时间和精力

依赖计算机硬件和软件环境等因素

测试数据设计困难

事前分析估算方法 – 在计算机程序编制前, 依据统计方法对算法进行估算

影响运行时间的因素

1. 算法采用的策略, 方法

2. 编译产生的代码质量

3. 问题的输入规模

4. 机器执行指令的速度

编译产生的代码质量与软件有关, 机器执行指令的速度与硬件有关, 所以一个程序的运行时间, 依赖于算法采用的策略和问题的输入规模.

第一种算法

int sum = 0, n = 100; /* 执行1次 */

sum = (1 + n) * n / 2; /* 执行1次 */

printf(“%d\n”, sum); /* 执行1次 */

第二种算法

int i, sum = 0, n = 100; /* 执行1次 */

for (i = 1; i <= n; i++) { /* 执行了n+1次 */

sum = sum + i; /* 执行n次 */

}

printf(“%d\n”, sum); /* 执行1次 */

第一种算法执行了3次, 第二种算法执行了2n+3次

两个算法中第一条和最后一条是一样, 忽略循环判断的开销

第一种执行1次, 第二种执行n次

第一种f(n) = 1, 第二种f(n) = n

测定运行时间最可靠的方法就是计算对运行时间有消耗的基本操作的执行次数.

函数的渐近增长

给定两个函数f(n)和g(n), 如果存在一个整数N, 使得所有的n > N, f(n)总是比g(n)大, 那么, 我们说f(n)的增长渐近已于g(n)

我们可以忽略这些加法常数

与最次项相乘的常数并不重要

最高次项的指数大的, 函数随着n的增长, 结果也会变得增长特别快

判断一个算法的效率时, 函数中的常数和其他次要项常常可以忽略, 而更应该关注主项(最高阶项)的阶数

事前估算方法的理论依据 – 某个算法, 随着n的增大, 它会越来越优于另一算法, 或者越来越差于另一算法.

算法时间复杂度

又称为算法的渐近时间复杂度

定义

在进行算法分析时, 语句总的执行次数T(n)是关于问题规模n的函数, 进而分析T(n)随n的变化情况并确定T(n)的数量级. 算法的时间复杂度记作: T(n) = O(f(n)). 它表示随问题规模n的增大, 算法执行时间的增长率和f(n)的增长率相同, 称作算法的渐近时间复杂度, 简称为时间复杂度.

f(n)是问题规模n的某个函数.

T(n)语句总的执行次数

O()来体现算法时间复杂度的记法, 称之为大O记法

随着n的增大, T(n)增长最慢的算法为最优算法