算法的定义及运行效率

这是我参与更文挑战的第19天,活动详情查看: 更文挑战

定义

解决特定问题求解步骤的描述

指令的有限序列, 每条指令表示一个或多个操作

五大基本特性

输入 – 算法具有0个或多个输入

输出 – 算法至少有1个或多个输出

有穷性 – 算法在执行有限的步骤之后, 自动结束而不会出现无限循环, 并且每一个步骤在可接受的时间内完成

确定性 – 算法的每一步骤都具有确定的含义, 不会出现二义性

可行性 – 算法的每一步都能够通过执行有限次数完成

五大设计要求

正确性 – 能正确反映问题的需求, 能得到问题的正确答案

​ 分为4个层次:

​ 没有语法错误

​ 对于合法的输入数据能够产生满足要求的输出结果

​ 对于非法的输出数据能够得出满足规格说明的结果

​ 对于刁难的测试数据能有满足要求的输出结果

可读性 – 便于阅读, 理解和交流

健壮性 – 当输入数据不合法时, 算法也能做出相关处理

时间效率高 – 算法的执行时间短

存储量低 – 算法在执行过程中需要的最大存储空间低

花最少的钱, 用最短的时间, 办成同样的事

算法效率的度量方法

算法效率 – 算法的执行时间

事后统计方法 – 利用计算机计时器对不同算法编制的程序的运行时间来进行比较

​ 缺点:

​ 依据算法事先编制好程序, 花费时间和精力

​ 依赖计算机硬件和软件环境等因素

​ 测试数据设计困难

事前分析估算方法 – 在计算机程序编制前, 依据统计方法对算法进行估算

影响运行时间的因素

​ 1. 算法采用的策略, 方法

​ 2. 编译产生的代码质量

​ 3. 问题的输入规模

​ 4. 机器执行指令的速度

编译产生的代码质量与软件有关, 机器执行指令的速度与硬件有关, 所以一个程序的运行时间, 依赖于算法采用的策略和问题的输入规模.

第一种算法

int sum = 0, n = 100; /* 执行1次 */

sum = (1 + n) * n / 2; /* 执行1次 */

printf(“%d\n”, sum); /* 执行1次 */

第二种算法

int i, sum = 0, n = 100; /* 执行1次 */

for (i = 1; i <= n; i++) { /* 执行了n+1次 */

sum = sum + i; /* 执行n次 */

}

printf(“%d\n”, sum); /* 执行1次 */

第一种算法执行了3次, 第二种算法执行了2n+3次

两个算法中第一条和最后一条是一样, 忽略循环判断的开销

第一种执行1次, 第二种执行n次

第一种f(n) = 1, 第二种f(n) = n

测定运行时间最可靠的方法就是计算对运行时间有消耗的基本操作的执行次数.

函数的渐近增长

给定两个函数f(n)和g(n), 如果存在一个整数N, 使得所有的n > N, f(n)总是比g(n)大, 那么, 我们说f(n)的增长渐近已于g(n)

我们可以忽略这些加法常数

与最次项相乘的常数并不重要

最高次项的指数大的, 函数随着n的增长, 结果也会变得增长特别快

判断一个算法的效率时, 函数中的常数和其他次要项常常可以忽略, 而更应该关注主项(最高阶项)的阶数

事前估算方法的理论依据 – 某个算法, 随着n的增大, 它会越来越优于另一算法, 或者越来越差于另一算法.

算法时间复杂度

又称为算法的渐近时间复杂度

定义

在进行算法分析时, 语句总的执行次数T(n)是关于问题规模n的函数, 进而分析T(n)随n的变化情况并确定T(n)的数量级. 算法的时间复杂度记作: T(n) = O(f(n)). 它表示随问题规模n的增大, 算法执行时间的增长率和f(n)的增长率相同, 称作算法的渐近时间复杂度, 简称为时间复杂度.

f(n)是问题规模n的某个函数.

T(n)语句总的执行次数

O()来体现算法时间复杂度的记法, 称之为大O记法

随着n的增大, T(n)增长最慢的算法为最优算法

推导大O阶方法的三个步骤

​ 1. 用常数1取代运行时间中的所有加法常数

​ 2. 只保留最高阶项

​ 3. 如果最高阶项存在且不是1, 则去除与这个项相乘的常数

常数阶

int sum = 0, n = 100; /* 执行1次 */

sum = (1 + n) * n / 2; /* 执行1次 */

printf(“%d\n”, sum); /* 执行1次 */

这个算法的运行次数函数是f(n) = 3.

推导大O阶的方法, 所有常数项改为1, 它没有最高阶项

所以这个算法的时间复杂度为O(1), 也叫常数阶

线性阶

分析循环结构的运行情况

也就是执行n次时间复杂度为O(1)的代码

int i, sum = 0, n = 100; /* 执行1次 */

for (i = 1; i <= n; i++) { /* 执行了n+1次 */

sum = sum + i; /* 执行n次 */

}

printf(“%d\n”, sum); /* 执行1次 */

时间复杂度为O(n)

对数阶

int count = 1, n = 100, time = 0; /* 执行1次 */

while (count < n) { /* 执行log1次 */

count = count * 2;

time++;

}

printf(“%d\n”, time); /* 执行1次 */

也就是2time = n, time = log2n

时间复杂度为log2n

指数阶

int i, j, x = 0, n = 100, sum = 0; /* 执行1次 */

for (i = 0; i < n; i++) { /* 执行n次 */

for (j = 0; j < n; j++) { /* 执行n*n次 */

​ x++;

​ sum += x; /* 执行n*n次 */

}

}

时间复杂度为O(n)的语句, 再循环n次

时间复杂度为O(n2)

int i, j, n = 100;

for (i = 0; i < n; i++) {

​ for (j = i; j < n; j++) {

​ /* 时间复杂度为O(1)的时间复杂度步骤序列 */

​ }

}

n + (n-1) + (n-2) = n2/2 + n/2

去掉常数, 去掉跟最高阶相乘的常数

时间复杂度为n2

常见的时间复杂度

所耗费的时间从小到大是:

O(1) < O(log(n)) < O(n) < O(n(log(n))) < O(n2) < O(n3) < O(2n) < O(n!) < O(nn)

最坏情况与平均情况

查找一个数组中的某个数字

最好情况 – 数组中的第一个数字就是要找的

最坏情况 – 数组中的最后一个数字是要找的

平均时间复杂度 – 计算所有情况的平均值

最坏时间复杂度 – 最坏情况下的时间复杂度

一般在没有特殊说明的情况下都是指最坏的时间复杂度

算法空间复杂度

通过计算算法所需的存储空间实现, 公式: S(n) = O(f(n))

n为问题的规模

f(n)为语句关于n所占存储空间的函数

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享