数据结构的基本概念
基本概念和术语
数据:数据是信息的载体,是所有能输入到计算机中并被计算机程序识别和处理的符号的集合
数据元素:数据元素是数据的基本单位,一个数据元素可由若干数据项组成
数据项:数据项是构成数据元素不可分割的最小单位,如学生记录是数据元素,里面的姓名等是数据项
数据对象:数据对象是具有相同性质的数据元素的集合,如整数数据对象是集合
数据类型:数据类型是一个值的集合和定义在此集合上的一组操作的总称
原子类型:其值不可再分的数据类型
数据类型:其值可以再分解为若干成分的数据类型
抽象数据类型:抽象数据组织及与之相关的操作,如栈就是抽象数据类型
数据结构:数据结构是相互之间存在一种或多种特定关系的数据元素的集合
数据结构包括三方面的内容:逻辑结构、存储结构、数据的运算
数据的逻辑结构和存储结构是不可分的两个方面,算法设计取决于逻辑结构,算法实现取决于存储结构
数据结构三要素
数据的逻辑结构
逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据
数据的逻辑结构分为线性结构和非线性结构
线性结构:线性表、栈和队列、串、数组
非线性结构;集合、树形结构、图状结构
数据的存储结构
存储结构是指数据结构在计算机中的表示,也称物理结构
顺序存储:逻辑上相邻的元素存储在物理位置上也相邻的存储单元中
链式存储:借助元素存储地址的指针令逻辑相邻的元素在物理上不必相邻
索引存储:在存储元素信息的同时,还建立附加的索引表
散列存储:根据元素的关键字直接计算出该元素的存储地址,又称哈希存储
数据的运算
施加在数据上的运算包括运算的定义和实现
运算的定义是针对逻辑结构的,指出运算的功能
运算的实现是针对存储结构的,指出运算的具体操作步骤
算法与算法评价
算法的基本概念
算法是对特定问题求解步骤的一种描述
一个算法具有下列 5 个重要特性:
有穷性:一个算法必须在有穷步后结束,运行时间是有穷的
确定性:算法中每条指令必须有确切的含义,同样输入会有同样输出
可行性:算法的操作有可以通过已实现的基本运算来实现
输入:一个算法有零或多个输入
输出:一个算法有零阔多个输出
一个好的算法应当考虑达到以下目标:
正确性:算法应当正确解决问题
可读性:算法应具有良好的可读性,以帮助人们理解
健壮性:能够处理非法数据,不会产生莫名其妙的输出
效率与低存储量要求:效率指算法的执行时间,存储量需求指算法执行过程所需的最大存储空间
算法效率的度量
时间复杂度
一个语句的频度是指该语句在算法中被重复执行的次数
时间复杂度 T(n) 是指算法中所有语句的频度之和,它是算法规模 n 的函数
经常采用同数量级频度的 f(n) 来分析算法的时间复杂度,T(n) = O(f(n))
其中 O 的定义是存在常数 C 和
当不同情况的时候,时间复杂度也会不一样:
最坏时间复杂度:指在最坏情况下,算法的时间复杂度
平均时间复杂度:指所有可能输入实例在等概率出现的情况下,算法的期望运行时间
最好时间复杂度:指在最好情况下,算法的时间复杂度
一般总是考虑在最坏情况下的时间复杂度
分析程序时间复杂度的两条准则:
加法准则:
乘法准则:
常见的渐进复杂度为:
考点追踪:分析算法的时间复杂度(高频:2010—2021、2025)
在统考真题中,无论是算法设计大题还是单项选择题,通常都会要求分析算法的时间复杂度。这是历年必考的核心素质。
归纳总结:时间复杂度求解实战法
测试时不要凭直觉,务必将问题抽象为以下两种情形:
1. 循环主体中的变量参与循环条件的判断
必须求出经过
次循环后循环变量的值与规模 的关系。
例如:
while (i <= n) i = i * 2;
设执行次数为
,则满足 ,即 ,故 。
2. 循环主体中的变量与循环条件无关(内外层嵌套)
直接列出数学累加求和式求出精确阶次:
例如内外两层循环情况:
for (i=1; i<=n; i++) for (j=1; j<=i; j++) count++;
它的频度
,故 。
空间复杂度
算法的空间复杂度 S(n) 定义为该算法所消耗的存储空间,它是问题规模 n 的函数,S(n) = O(g(n))
辅助空间是指对数据进行操作的工作单元和存储一些为实现计算所需信息的空间
算法原地工作是指算法所需的辅助空间为常量,即 O(1)
思维拓展
斐波那契数列的时间复杂度
对于递归而言,斐波那契数列形成树形结构的函数调用,所以时间复杂度是
对于非递归而言,使用数组存储上一个值,所以迭代就可以,时间复杂度 O(n)
