算法学习笔记

平衡树

说到平衡树，很多人的第一印象就是：难学（知识点真多）难懂（特别是“旋转”和证明）难调（我的某个教练刚学平衡树的时候调了七个小时）下面我们就来从0开始讲平衡树。（注：网上大多数人说到“平衡树”默认指的是“Splay”而不是其他算法）定义其实平衡树（Balance Tree，简称BT）不算一种算法，而是一种统称。平衡树顾名思义就是非常平衡的树。比如说这棵树就非常不平衡：而这棵树就比较平衡：如果说的更形式化，平衡就意味着，对于每个点，其所有子树的大小差都不超过 $1$。具体而言，对于每个点 $x$，如果我们把其所有儿子 $to$ 的子树大小都列出来，那么这个数组内最大值和最小值差不超过 $1$。而且，大多数平衡树都是二叉树，这一点是为了方便操作和设计算法。种类听完上面的定义，你就知道了，平衡树就是一类树状数据结构的统称。下面就来列举一下这类数据结构都有哪些，以及这些数据结构的简介。二叉搜索树（Binary Search Tree，简称BST）大多数平衡树的前置算法，这也就意味着，大多数的平衡树都是基于BST并进行优化、扩展后得到的算法。而BST也是线段树（Segment Tree，部分情况下会简称为ST）进行扩展后的算法。具体而言，权值线段树和BST都可以维护有序集合，但有时候只能用BST解决。 BST其实就是把权值“当做”节点编号（讲的时候一般就这么讲，但写的时候不能这么写，是把权值存入该节点的结构体内）。然后对于每个点，它都有最多 $2$ 个儿子，左儿子权值 $<$ 当前点权值 $<$ 右儿子权值。这样就可以方便查找。优点：代码好写，容易讲明白缺点：解决题型少，需要写定期重构（又被称作“替罪羊树思想”），复杂度高 Treap（名字不是一个单词，而是两个单词Tree和Heap的结合）这个算法给每个节点都添加了一个“优先级”，并让“优先级”满足小/大根堆的性质。并且，这里还通过“旋转”操作（最头疼的地方来了）让树尽量平衡，这样会让树高稳定在 $O(\log n)$ 级别。（不过注意，在最坏情况下，复杂度会达到 $O(n)$，所以 $O(\log n)$ 只是期望）这样，复杂度就降下来了。优点：复杂度低，比较容易理解，解决题型多，且容易被识别出缺点：比较难写，细节较多，复杂度难证明 Splay（本意为“张开”但这里不是这个意思）这个算法对上面的“旋转”操作又做了一遍扩展，让其能够解决子串翻转问题。而且，由于它也会让整棵树尽量平衡，所以树高还是会稳定在 $O(\log n)$ 级别。 ...

生成随机数（未完工）

参考引用头文件（常用） #include <stdlib.h> //生成随机数、设定随机数种子 #include <ctime> //生成随机数种子（1） #include <time.h> //生成随机数种子（2） #include <unistd.h> //等待（sleep(...)或usleep(...)），该头文件现在不常用随机种子 srand(time(0) ^ clock()); 注：随机种子为time(0) ^ clock()，这个随机种子可以再毫秒级别内生成（大概率）不同的随机种子。取 $[l,r]$ 内的随机数 #define random(l, r) (rand() % ((LL)(r) - (LL)(l) + 1) + (LL)(l)) 注：rand函数只能生成 $[1,32767]$ 内的随机数（见宏RAND_MAX），大概只能生成位数 $\leq 5$ 的随机数；测试程序： LL ma = 0; for(LL i = 1;i <= 200;i++){ srand(time(0) ^ clock()); LL t = rand(); cout << t <<endl; ma = max(ma, t); usleep(10000); } cout << ma <<endl; 所以此处引用一个新方法：mt19937（2022/12/24：现在开始使用mt19937_64了，它可以生成 $[1,2^{64})$ 内的随机数，大一倍）。其实它的语法和rand的语法差不多（才怪），是这样的：引用头文件（常用） #include <random> //生成随机数、设定随机数种子 #include <ctime> //生成随机数种子（1） #include <time.h> //生成随机数种子（2） #include <unistd.h> //等待（sleep(...)或usleep(...)），该头文件现在不常用随机种子 mt19937 _rand(time(0) ^ clock()); 注：这个随机种子也可以再毫秒级别内生成（大概率）不同的随机种子取 $[l,r]$ 内的随机数（就差一个字符_而已） #define random(l, r) (_rand() % ((LL)(r) - (LL)(l) + 1) + (LL)(l)) 据测试，这个函数可以生成在unsigned int范围内的随机数（即可以生成 $[1,2^{32})$ 内的随机数），测试程序： ...

树链剖分

第一次看到树链剖分（简称树剖）可能觉得它非常的深奥，但其实树剖的原理非常简单，下面先说树剖大概的实现思路和解决题型。概览其实树剖就是把一棵树分成若干条链，使得每个点都出现在了刚好一条链上。并且，我们称在某条链上的边为“重（zhòng）边”，不在任何一条链上的边为“轻边”。然后，我们按某种规则去DFS，求出新的DFS序，然后解决对树上路径询问的问题。而且，通过合理的设计每条边的轻重，可以把复杂度控制在 $O(\log n)$ 级别。解决题型上面也提到了，树剖就是用来解决对树上路径进行询问的问题的算法，当然也可以解决对子树询问的问题，不过属于大材小用了。此外，树剖属于工具类算法，所以往往会配合树状数组、线段树、分块等算法出现。我把算法分为了两类，“材料类算法”和“工具类算法”，其中：材料类算法可以单独考，比如：数论推公式 DP 树状数组线段树 … 工具类算法里面必须要套材料类算法才能考出来，比如：二分 01分数规划（二分的一个分支） CDQ分治（需要配合树状数组）整体二分（需要配合树状数组）树剖（这里讲的） … 往往一些较难的题目，都是要用较难的材料类算法（比如DP），或者工具类算法配合材料类算法才能解决的题目。而对于后者，难度会更大一些，因为后者的关键在于转化后使用工具类算法解决。算法实现下面说一下树剖的实现。两遍DFS 我们考虑DFS，当递归到点 $x$ 的时候，找到 $x$ 的儿子中，子树大小最大的那个儿子 $to$。然后，我们把 $x \to to$ 这条边设为重边，其他边设为轻边。得到每条边的轻重后，我们再做一遍DFS。而这一遍DFS是为了找到DFS序。而且，DFS序有一个要求，我们要先遍历有重边连接的儿子。这样的话，对于任意一条树上的链，链上所有点的DFS序连续，而且是由深度从浅到深依次递增。同时，我们还要求出，从一个点开始，不经过任何轻边，最多到哪个点。解决询问而对于一次路径上某值的询问，我们可以把这个路径拆成若干条链。可以证明链数不超过 $O(\log n)$，这一点会在下面“复杂度证明”中证明。而这些拆出的链，都是原树中的链的“子集”（一条链 $L_1$ 是另外一条链 $L_2$ 的子集，有且仅当 $L_1$ 中的点，$L_2$ 中也有，边同理）。所以，可以把一条路径，拆成最多 $O(\log n)$ 个DFS序区间。 ...

四边形不等式

（四边形不等式看标题可能觉得很难，其实比较简单）四边形不等式是一种DP优化的技巧，一般针对二维DP进行优化。在DP中，往往会有多个决策点，而其中就有一个是最优的，设 $d_{i,j}$ 的最优决策点为 $f_{i,j}$。（以下假设DP枚举决策点的复杂度为 $O(n)$，DP状态数为 $O(n^2)$）而四边形不等式就是说，如果满足 $f_{i,j-1} \leq f_{i,j} \leq f_{i+1,j}$，那么可以把DP枚举决策点的范围降至 $[f_{i,j-1},f_{i+1,j}]$，然后DP的复杂度就从 $O(n^3)$ 降到了 $O(n^2)$。而这个（复杂度）怎么证明呢？我们画一下 $f$ 数组的表：（此处，我们以 $i$ 为行号，以 $j$ 为列号，行、列号都从 $1$ 开始编号）然后，画几个标记：这些标记指的是，在转移 $d_{1,2}$ 的时候，转移点枚举的左右端点分别就是红箭头指向的两个数。同时，为了方便观察，此处还画了个蓝色的虚线。同理，还可以画出 $d_{2,3}$ 对应的标记：以此类推：可以发现，其实这时候所有蓝线的长度（蓝线连接的两个数字的差值定义为这个蓝线的长度）之和，最多只有 $n$。而对于 $d_{1,3}$ 一“类”的标记：可以发现，其实那些蓝线的长度之和也是最多只有 $n$。在画出所有蓝线之后：可以发现，一共就有 $n$ “类”蓝线，一“类”蓝线的长度之和最多 $n$，至此，可以证明复杂度（所有蓝线的长度之和）为 $O(n^2)$。接下来讲几类四边形不等式解决的经典题型：第一类：$d_{l,r}=\min { d_{l,k}+d_{k+1,r} | l \leq k \leq r }+w_{l,r}$，合并石子类。第二类：$d_{i,j}=\min { d_{k,j-1}+w_{k+1,i} | 0 \leq k \leq i }$，区间分割类。（这两类对应的公式里的 $\min$ 也可以替换成 $\max$） ...

同余最短路

同余最短路看名字感觉很难，但其实非常简单，也好理解，先说一道题：题目原型：洛谷P3403 跳楼机有一栋 $h$ 层的大楼（层数编号从 $1$ 到 $h$），有 $n+1$ 种移动方式：回到 $1$ 层向上走 $x_1 \sim x_n$ 层楼层不是循环的，你无论如何都无法到达 $h+1$ 层或以上。最初你可以在任意一层（但也无关紧要），问你能到达多少个不同的楼层。题解分类我们按楼层模 $x_1$ 的余数分类，把楼层 $i$ 分到 $i \bmod x_1$ 类。这样分类有什么用呢？见下。定义状态有了这个分类，我们可以定义状态 $d_i$（$i \in [0,x_1)$）代表不用「向上走 $x_1$ 层」操作能到达的、最小的第 $i$ 类楼层是多少。那么，由于有「向上走 $x_1$ 层」操作，所以 $d_i,d_i+x_1,d_i+2x_1,\dots$（比 $d_i$ 大或相等的第 $i$ 类楼层）都是可达的。接下来考虑转移这个状态。转移其实也很好想，比如用一次「向上走 $x_2$ 层」操作，那么 $d_i$ 可以转移到 $d_{(i+x_2) \bmod x_1}$，转移代价为 $x_2$，所以： $d_{(i+x_2) \bmod x_1}=\min(d_{(i+x_2) \bmod x_1},d_i+x_2)$ ...

行列式

要说行列式，就得先说一下矩阵（其实是方阵）的秩的定义。对于一个方阵，其秩的定义就是矩阵里线性无关的极大值。听这个定义有点难懂，这里解释一下。其实一个方阵就可以被当做是一个没有右项的方程集。而一个方阵的秩就可以当做是，这个没有右项的方程集在经过高斯消元后，非 $0$ 行的数量。有了这个定义，矩阵的秩还可以被当做是，这个没有右项的方程集中，不会被其他方程替代掉的方程数量：解释一下，如果方程长这样： $ \begin{cases} -x_1+2x_2+5x_3=11 \ 2x_1=8 \ x_1+2x_2+5x_3=19 \end{cases} $ 那么，其实第三个方程式可以通过前两个方程式推出来，也就称作第三个方程式可以被前两个方程式替代掉。知道了“替代”的定义后，就知道了一件事，就是上面说的“会被其他方程替代掉的方程”，这些方程可以直接从方程组里去掉，而不影响最终的解。所以，我们就可以对奥数里的一个点做一个更简洁的解释：在奥数里，讲了解 $n$ 元一次方程（组）的方法。同时还说了，在这个 $n$ 元一次方程组内，如果“有用”的方程数量，刚好等于未知数的数量，或者大于未知数的数量，那么这个方程组就有唯一解。这一点可以被更简洁地解释为：这个 $n$ 元一次方程组，转化为“高斯矩阵”，并删除最后一列后（变成 $n \times n$ 的方阵），如果这个方阵的秩刚好为 $n$，那么这个方程组就有唯一解。然后，我们回归正题，说行列式。行列式是对于一个方阵来讲的，一个方阵有行列式有且仅当这个方程的秩刚好等于方阵的大小（行或者列）。行列式的定义此处不讲，因为：太复杂了（几乎）没有用处行列式的计算方法是用的高斯消元。在高斯消元的思路里，提到了三种“基本行变换”：（以下全部以高斯矩阵的角度去说）将一行全部乘上一个非 $0$ 实数 $x$，解不变。将一行内的所有元素对应地加上/减去另一行对应的元素乘上一个非 $0$ 实数 $x$，解不变。交换两行，解不变。这三种基本行变换在执行前后，行列式并不是都不变的：将一行全部乘上一个非 $0$ 实数 $x$，行列式也会乘上 $x$。将一行内的所有元素对应地加上/减去另一行对应的元素乘上一个非 $0$ 实数 $x$，行列式不变。交换两行，行列式变号（负数变成正数，反之亦然）。所以我们只用写一下高斯消元，然后处理一下对行列式的值的变化即可。但这儿还有一点问题，就是行列式怎么求。求法很好记，如果说当前方阵是个上三角矩阵（设方阵叫 $a$，那么 $a$ 是个上三角矩阵有且仅当对于所有的 $(i,j)$，如果满足 $i>j$，那么 $a_{i,j}$ 一定要等于 $0$，当然其他方格不做要求），那么这个方阵的行列式就是这个方阵中正对角线上的元素的乘积。 ...

一个非常重要的语法点

说一个非常重要的语法错误。如果你写这样一句话： v[x] = newnode(); 其中： v为一个vector。 x为不越界的非负整数，且不会变化。 newnode()函数内会向vector内push_back一个新元素，并返回加入元素（即最后一个元素）的下标。那么，你会发现，v[x]的值并不是这样变化的： 1,2,3,4,5,6,7,... 而是类似于这样的：（非真实输出结果，仅供参考） 1,1,2,2,3,4,4,5,6,7,8,8,9,10,11,12,13,14,15,16,16,17,18,19,20,... 你会发现部分情况下，v[x]没有变化！这实际上是因为vector的内部机制。 vector会有一个capacity，就是提供的内存大小。每次push_back的时候，如果说加入后，不超过当前的capacity，就会直接加入。否则，vector会新开辟一块等于当前capacity的两倍（这个在不同编辑器上是不一样的，有些可能是每次新增 $5$ 个）的新空间，并把原本的数据拷进这块新空间内。比如说现在的vector是：内存354~357位置：3 1 2 4 且capacity是 $4$，那么我们如果尝试push_back一个 $5$，则vector就会发现大于了capacity，便会新开一块等于当前capacity的两倍的空间：内存354~357位置：3 1 2 4 内存382~389位置：并把当前数据拷进去：内存354~357位置：3 1 2 4 内存382~389位置：3 1 2 4 然后在新空间内加入 $5$：内存354~357位置：3 1 2 4 内存382~389位置：3 1 2 4 5 并把所有v[x]指向的内存都改成382~389这块新内存内对应的地方。不过由于C++的赋值机制，系统会先找到要赋值给的变量的指针，然后求出要赋的值，赋给以前找到的指针。（这一步是推测，可能不准确）所以就会导致把newnode()的值赋给了原本的v[x]，导致输出的时候访问的新v[x]值出错。解决方法也很简单，把newnode()用个临时变量t存储，并将v[x]赋值为t即可。

一元二次方程解法（未完工）

在数学、编程界里，可能会经常遇到方程，而且有时候还会遇到一种特殊方程——一元二次方程。除此之外，还有含参一元二次方程，这里也会一起讲。（待补充）其实还有如二元一次方程、一元三次方程等的特殊方程，但在这里不讲。一元二次方程有人看到“一元二次方程”就不知道是啥意思，这里先说一下定义定义首先，方程相信大家都见过，所以这里不写对方程的定义解释。（废话而 $x$ 元 $y$ 次方程就是这么定义的：这个方程经过化简后，共有 $x$ 个未知数，且未知数上的最大指数为 $y$ 的方程。如： $3(x+1)=6x$：一元一次方程，也是最常见的方程。 $3(x+1)^2=2(x+1)$：一元一次方程，因为两边可以同时除以 $x+1$ 以让指数减少 $1$。 $x^2-4x+1=0$：一元二次方程，也是下面要讲的方程类型。 $x^3+2x^2-1=16x$：一元三次方程，也是一种不常见的方程类型。讲完定义，接下来说怎么解解法推导我们把方程一般化，变成： $ax^2+bx+c=0$ 其中 $a$、$b$、$c$ 均为常量。然后，我们不断对方程做一些推导。移项 $ax^2+bx=-c$ 同时除以 $a$ 常量 $x^2+\dfrac{b}{a}x=-\dfrac{c}{a}$ 这个式子很多人看了就不知道怎么继续推导了。但还是可以继续转化的。我们考虑配方，即把式子的左/右项同时加/减/乘/除一个相同的数，然后让这个等式的左/右项变成一个数的平方的形式。这一步比较考验数感，一个结论就是，我们同时加上 $\left( \dfrac{b}{2a} \right)^2$ 常量即可。 $x^2+\dfrac{b}{a}x+\left( \dfrac{b}{2a} \right)^2=-\dfrac{c}{a}+\left( \dfrac{b}{2a} \right)^2$ 化简 $\left( x+\dfrac{b}{2a} \right)^2=\dfrac{-c}{a}+\dfrac{b^2}{4a^2}$ 二次化简 $\left( x+\dfrac{b}{2a} \right)^2=\dfrac{b^2-4ac}{4a^2}$ 同时开根号 $x+\dfrac{b}{2a}=\sqrt{\dfrac{b^2-4ac}{4a^2}}$ ...

整除分块

感谢这篇文章的作者整除分块主要解决求解 $\sum\limits_{i=1}^n \lfloor \frac{n}{i} \rfloor$ 的值。一看这个公式，可能毫无头绪，但画张图你就有点思路了：（$n=11$）（灰色线：$y=\frac{11}{x}$，绿色点：$y=\lfloor \frac{11}{x} \rfloor$，橙色线：仅为辅助）这张图其实就是在提示我们： $\lfloor \frac{n}{i} \rfloor$ 的值随着 $i$ 的增长而非单调递减 $\lfloor \frac{n}{i} \rfloor$ 的值往往会在一段区间内相等所以，我们就有一个思路了，就是求出所有值（下面的“值”都代指的是 $\lfloor \frac{n}{i} \rfloor$）相等的极大区间集，然后就可以快速统计了。有人问，这不就是个常数级别的优化吗，怎么能叫“快速”呢？其实区间个数总是 $O(\sqrt{n})$ 级别，最多约 $2 \times \sqrt{n}$。证明：我们把 $i$ 分成两部分去考虑，一部分是 $i \leq \sqrt{n}$，另一部分是 $i>\sqrt{n}$。在第一部分内，$i$ 也就只有 $\sqrt{n}$ 种取值，$\lfloor \frac{n}{i} \rfloor$ 最多只有约 $\sqrt{n}$ 种取值。在第二部分内，$\lfloor \frac{n}{i} \rfloor$ 在 $i$ 最小时（$i=\sqrt{n}+1$）会达到最大值，约 $\sqrt{n}$；而上面说“$\lfloor \frac{n}{i} \rfloor$ 的值随着 $i$ 的增长而非单调递减”，所以易得 $\lfloor \frac{n}{i} \rfloor$ 最多也只有约 $\sqrt{n}$ 种取值。 $\lfloor \frac{n}{i} \rfloor$ 的总取值种数最多只有第一、二部分的取值个数和，即 $2 \times \sqrt{n}$，证毕。 ...

整体二分

整体二分类似于线段树上二分，在讲这个算法前，先引入几个问题。解决题型整体二分一般解决的是如下的问题：给你一个【集合/序列/矩阵/树】，要求【静态/动态】维护所有【元素/区间/子矩阵/链/子树】中的第 $k$【可能每次给定】大元素，【可能强制在线】。下面是一堆例题。例题1 动态查询集合第k大（可离线）题意让你维护一个初始为空的多重集合 $s$，并支持 $q$ 次操作，操作都是下面三种之一：添加一个数 $x$ 到集合 $s$ 中。在集合 $s$ 中删除一个数 $x$（保证元素存在）。查询集合第 $k$ 大（保证第 $k$ 大存在）。数据范围 $1 \leq q \leq 2 \times 10^5$ $0 \leq x \leq 10^9$ 题解维护一个权值线段树（权值线段树其实就是一个维护值域的线段树），维护一段值域里有多少个数，每次询问在线段树上二分即可。具体地，对于线段树上某个节点对应的区间 $[l,r]$，这个节点上的值为集合中，值在 $[l,r]$ 的数的个数有多少。在询问时，我们要记录当前节点编号 $x$，$x$ 维护区间 $[l,r]$，以及要查询值在 $[l,r]$ 内的所有数的第 $k$ 大。当递归到某个状态后，我们看这个节点的左子树 $\text{lc}$ 内有多少个值，如果大于等于 $k$，则递归到左子树；否则递归到右子树，且 $k$ 减去(左子树内数的个数)。由于值域较大，权值线段树可能会爆，所以要先把所有询问离线下来，做个离散化，然后就可以把 $x$ 控制到 $q$ 级别，就不会爆了。 ...