极客时间:数据结构与算法之美【文章笔记 & 实践 & 总结】

2023-09-18 20:00:20

27 | 递归树:如何借助树来求解递归算法的时间复杂度?

如何借助树来分析归并排序算法的时间复杂度?

归并排序递归树
每次分解一分为二,代价很低,时间上消耗记作O(1)。
每一层合并消耗时间相同,和数据规模相关,记作 O(n)。
归并排序递归树是一颗满二叉树,高度为 log2n。
归并排序时间复杂度:O(n logn)。

如何借助树来分析快速排序算法的时间复杂度?

平均情况:1 : k
k = 9 时。

快速排序递归树

每一层遍历 n 个元素。
快速排序结束条件:叶子节点 1 个元素。
根节点 n 个元素到叶子节点 1 个元素最短路径每一层乘 1 /10,最长路径每一层乘 9 / 10。
根节点到叶子节点最短路径:log10n,最长路径 log(10 / 9 ) n。
遍历个数在 n * log10 到 n * log(10 / 9 ) n 之间,快速排序时间复杂度为:O(n logn)。

k 的值不随 n 改变,对最终时间复杂度无影响。

如何借助递归树来分析斐波那契数列的时间复杂度?

斐波那契数列的递归树

f(n) 分解为 f(n - 1) 和 f(n - 2),每次数据规模 -1 或 -2,叶子节点数据规模是 1 或者 2。
根节点到叶子节点最长为 n ,最短为 n / 2。
合并的操作只需要一次加法运算,耗时记作 O(1)。
每一层消耗时间为 2^ (k - 1) ,路径长度为 n 总和为 2^n - 1。
在这里插入图片描述
路径长度为 n 总和为 2^(n / 2) - 1。
在这里插入图片描述
时间复杂度为指数级别。

如何借助递归树来分析全排列的时间复杂度?

最后一位有 n 种情况,求解 n 个 “n - 1数据的排列” 的子问题。

递推公式:

假设数组中存储的是123...n。
        
f(1,2,...n) = {最后一位是1, f(n-1)} + {最后一位是2, f(n-1)} +...+{最后一位是n, f(n-1)}

全排列

第一层有 n 此交换,第二层有 n (n - 1) 次交换,第三层有 n(n - 1)(n - 2) 此交换,最后一层有 n(n - 1)(n - 2) *…21 次交换。

总交换次数:

n + n*(n-1) + n*(n-1)*(n-2) +... + n*(n-1)*(n-2)*...*2*1
n*(n-1)*(n-2)*...*2*1 为 n!

总和小于 n * n!,全排列递归时间复杂度大于O(n!),小于O(n * n!)。时间复杂度非常高。

1 个细胞的生命周期是 3 小时,1 小时分裂一次。求 n 小时后,容器内有多少细胞?如何分析递归时间时间复杂度?

需要重新系统完整的分析。

28 | 堆和堆排序:为什么说堆排序没有快速排序快?

特殊的树:堆(Heap)。
堆排序:原地排序,时间复杂度为O(n logn)。

如何理解 “堆”?

堆满足的条件是什么?(2个)

  • 堆是一个完全二叉树。(除了最后一层,其他层节点个数都是满的,最后一层的节点都靠左排列。)
  • 堆中每个节点的值都大于等于[大顶堆](或小于等于[小顶堆])其左右子节点的值。

定义堆

1 和 2是大顶堆,3是小顶堆,4不是堆。

如何实现一个堆?

如何存储一个堆?

完全二叉树用数组存储。

完全二叉树

下标为 i 的左子节点下标为 i * 2,右子节点下标为 i * 2 + 1,父节点为下标 i / 2 的节点。

堆支持哪些操作?

插入元素

往堆中插入一个元素,满足堆的特性,通过堆化实现。堆

从下往上堆化:顺着节点所在的路径,向上或者向下,对比,然后交换。
堆化的详细过程
堆化的代码实现过程:

public class Heap {
  private int[] a; // 数组,从下标1开始存储数据
  private int n;  // 堆可以存储的最大数据个数
  private int count; // 堆中已经存储的数据个数

  public Heap(int capacity) {
    a = new int[capacity + 1];
    n = capacity;
    count = 0;
  }

  public void insert(int data) {
    if (count >= n) return; // 堆满了
    ++count;
    a[count] = data;
    int i = count;
    while (i/2 > 0 && a[i] > a[i/2]) { // 自下往上堆化
      swap(a, i, i/2); // swap()函数作用:交换下标为i和i/2的两个元素
      i = i/2;
    }
  }
 }
删除堆顶元素

把最后一个节点放在堆顶,父子节点对比,不满足父子节点大小关系的,互换两个节点。重复该过程,知道父子节点之间满足大小关系为止。

移除的是数组中最后一个元素,堆化的过程都是数据交换操作,不会出现数组空洞。
删除堆顶元素

代码演示:

public void removeMax() {
  if (count == 0) return -1; // 堆中没有数据
  a[1] = a[count];
  --count;
  heapify(a, count, 1);
}

private void heapify(int[] a, int n, int i) { // 自上往下堆化
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

n 个节点的完全二叉树,树高度不会超过 log2n。
堆化时间复杂度和树高度成正比,为O(log n)。
插入元素和删除堆顶元素主要逻辑是堆化,时间复杂度为O(log n)。

如何基于堆实现排序?

时间复杂度稳定为 O(n logn),原地排序算法。

建堆

第一种:在堆中插入一个元素的思路。从前往后处理数组,从下往上堆化。

第二种:从后往前处理数组,每个数据都从上往下堆化。
叶子节点往下堆化只能自己和自己比较,所以从最后一个非叶子节点开始堆化:
从上往下堆化
从上往下堆化

private static void buildHeap(int[] a, int n) {
  for (int i = n/2; i >= 1; --i) {
    heapify(a, n, i);
  }
}

private static void heapify(int[] a, int n, int i) {
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

建堆的时间复杂度:
叶子节点不需要堆化,需要堆化的节点从倒数第二层开始。每个节点的堆化过程,比较和交换的节点个数,根节点的高度 k 成正比。

每一层节点个数和对应的高度换出来如下:
节点个数及高度

将每个节点的高度求和,得出的就是建堆的时间复杂度。

每个非叶子节点高度求和:
每个非叶子节点高度求和

把公式左右都乘以 2,就得到另一个公式 S2。我们将 S2 错位对齐,并且用 S2 减去 S1,可以得到 S

结果

通过等比数列求和公式:
等比数列求和

h = log2你,带入公式,S = O(n),建堆时间复杂度为O(n)。

排序

数组中第一个元素,堆顶最大元素和最后一个元素交换,最大元素放到下标为 n 的位置。
将 n - 1 个元素重新构建成堆,再取堆顶元素放到 n - 1 ,一直重复,最后堆中只有下标为 1 的一个元素,排序工作就完成了。

堆排序

代码演示:

// n表示数据的个数,数组a中的数据从下标1到n的位置。
public static void sort(int[] a, int n) {
  buildHeap(a, n);
  int k = n;
  while (k > 1) {
    swap(a, 1, k);
    --k;
    heapify(a, k, 1);
  }
}

原地排序。
建堆时间复杂度为 O(n),排序过程时间复杂度为O(n logn),堆整体的时间复杂度为 O(n logn)。
不稳定排序。

解答开篇

堆排序数据访问方式没有快速排序友好。
快速排序,数据顺序访问,可以有效利用CPU缓存。
堆排序,数据跳着访问。

堆顶节点堆化,会依次访问数组下标1,2,4,8。
堆化

同样的数据,排序过程中,堆排序算法的数据交换次数多于快速排序。
快速排序数据交换次数不会比逆序度多。
堆排序第一步是建堆,建堆会打乱数据原有的先后顺序,导致原数据有序度降低。

堆化后有序度降低

内容小结

堆是一种完全二叉树。
大顶堆和小顶堆。

插入一个数据:新插入元素放到数组最后,从下往上堆化。时间复杂度:O(logn)
删除堆顶元素:将数组中最后一个元素放到堆顶,从上往下堆化。时间复杂度:O(logn)

堆排序:
建堆:将下标从 n / 2 到 1 的节点,依次从上到下堆化操作,将数组中的数据组织成堆这种数据结构。
排序:迭代的将堆顶元素放在堆末尾,将堆大小减一,然后再堆化。重复这个过程,直到堆中只剩下一个元素,整个数组中数据有序。

课后思考

对于完全二叉树来说,下标从 n / 2​+1 到 n 的都是叶子节点,这个结论是怎么推导出来的呢?

关于堆,你还能想到它的其他应用吗?

29 | 堆的应用:如何快速获取到Top 10最热门的搜索关键词?

更多推荐

月木学途开发 3.博客模块开发

概述效果展示数据库设计专栏表DROPTABLEIFEXISTS`blog_column`;CREATETABLE`blog_column`(`blogColumnId`int(11)NOTNULLAUTO_INCREMENT,`blogColumnName`varchar(255)DEFAULTNULL,`blogCo

功能测试如何编写测试用例

测试用例的编写需要按照一定的思路进行,而不是想到哪写到哪,一般测试机制成熟的公司都会有公司自己自定义的测试用例模板,以及一整套的测试流程关注点,当然我们自己在测试生涯中也应当积累一套自己的测试框架,所有功能性的测试都可以依据框架的思路来进行,达到事半功倍的效果。功能测试框架可以包括:界面友好性测试、功能测试、链接测试、

【Web3】创作者经济

这里写目录标题创作者经济是什么?创作者从Web1.0到Web3.0的演进Web1.0企业1985Web2.0平台的创作者2004Web3.0创造者/所有者2021粉丝经济的转变&四个阶段创作者经济的四个阶段创作者经济Web3.0工具创作者经济生态全景图OpenSeaFoundationPleasrDAONiftyPix

从 Hackathon 战队到创业公司,和开发者们聊聊真实世界 AI Apps 的基础设施丨活动预告

在不久前结束的TiDBFutureAppHackathon2023上,来自全球88个国家的1492名参赛者们借助AI和TiDBServerless的能力,构建了许多令人印象深刻的项目。打造Hackathon的项目是一个从0-1的过程,真实世界中也涌现出了一批创业公司正在围绕AI打造创新应用,并实现了规模化,取得了商业成

西门子S7协议及报文格式详解

一、简介S7Comm(S7Communication)是西门子专有的协议,是西门子S7通讯协议簇里的一种。S7通信协议是西门子S7系列PLC内部集成的一种通信协议,是S7系列PLC的精髓所在。它是一种运行在传输层之上的(会话层/表示层/应用层)、经过特殊优化的通信协议,其信息传输可以基于MPI网络、PROFIBUS网络

【pdf密码】打开PDF文件之后发现不能编辑,什么原因?

打开PDF文件的时候,没有提示带有密码,但是打开文件之后发现没有办法编辑PDF文件,这个是因为PDF文件设置了限制编辑,我们需要将限制取消才能够编辑文件。那么,我们应该如何取消密码,编辑文件呢?方法如下:打开PDF编辑器,点击工具栏中的文件,选择属性按钮,进入到熟悉感界面之后,点击安全,然后我们点击权限下拉框,选择无保

vue前后端分离单点登录,结合长token和短token进行登录

单点登录背景在公司发展初期,公司拥有的系统不多,通常一个两个,每个系统都有自己的登录模块,运营人员每天用自己的账号登陆,很方便,但是,随着企业的发展,用到的系统随之增加,运营人员在操作不同的系统时,需要多次登录,而且每个系统的账号都不一样,这对于运营人员来说很不方便,也是就想到是不是可以在一个系统登陆,其它系统就不用登

无人车参考车辆与硬件平台

参考视频:Apollo自动驾驶入门课程参考车辆和硬件平台打造一个无人车,首先要开发一款可通过电子控制的基础车辆,而不仅仅是通过实体方向盘、油门踏板和刹车踏板来控制。这种类型的车辆具有特殊的名称:线控驾驶车辆该车有多种不同的传感器,参数由参考硬件规格定义。控制区域网络(CAN)车辆的内部通信网络,计算机系统通过CAN卡连

Java中的错误和异常

在Java中,错误(Error)和异常(Exception)是两种不同的情况。错误(Error)错误(Error)是指在程序运行过程中发生的严重问题,通常是由于系统资源不足或者虚拟机出现故障等原因引起的。错误是无法通过代码来处理或者捕获的,一旦发生错误,程序将无法继续执行。常见的错误包括OutOfMemoryError

Oracle SQL操作和查询

文章目录一、SQL简介二、数据类型讲解三、创建表和约束1.表结构2.更新表结构3.约束四、DML语句1.INSERT2.序列号3.UPDATE4.删除语句5.多行插入五、DQL语句1.简单查询语句1.1知识点讲解1.2案例讲解2.聚合函数3.分组查询4.多表查询一、SQL简介SQL是结构化查询语言(Structured

计算机竞赛 深度学习YOLOv5车辆颜色识别检测 - python opencv

文章目录1前言2实现效果3CNN卷积神经网络4Yolov56数据集处理及模型训练5最后1前言🔥优质竞赛项目系列,今天要分享的是🚩**基于深度学习YOLOv5车辆颜色识别检测**该项目较为新颖,适合作为竞赛课题方向,学长非常推荐!🥇学长这里给一个题目综合评分(每项满分5分)难度系数:3分工作量:3分创新点:4分🧿

热文推荐