最近公共祖先 LCA

什么是 LCA

最近公共祖先（Lowest Common Ancestor，简称 LCA）是树上最基础的问题之一：在一棵有根树中，两个节点的所有公共祖先里，深度最大（离根最远）的那个节点，就是它们的 LCA。

举个例子：对于查询 $(u, v)$ ，它们的 LCA 同时是 $u$ 和 $v$ 的祖先，并且在所有公共祖先中离根最远。求解 LCA 是树上差分、树上路径查询、虚树构建等众多高级算法的基础。

接下来，我们由浅入深地介绍几种主流的 LCA 求法。

方法一：暴力跳父节点

这是最直观的方法。先通过一次 DFS 预处理出每个点的父节点 fa[u] 和深度 dep[u]，查询时不断将深度较大的节点向上跳，直到两个节点相遇。

flowchart TD A["输入 u, v"] --> B["dep[u] < dep[v]?"] B -->|是| C["swap(u, v)"] B -->|否| D["u = fa[u]"] C --> D D --> E{"u == v?"} E -->|否| B E -->|是| F["返回 u"]

复杂度：预处理 $O(n)$ ，单次查询 $O(n)$ ， $m$ 次查询总复杂度 $O(nm)$ 。

评价：实现极其简单，但当树退化为一条链时，每次查询可能遍历整棵树，在 $n$ 、 $m$ 均达到 $5 \times 10^5$ 的模板题中完全无法通过。仅适合 $n$ 较小或树极为平衡的特殊场景。

//参考代码
int lca(int u, int v) {
 while (u != v) {
 if (dep[u] < dep[v]) swap(u, v);
 u = fa[u];
 }
 return u;
}

方法二：倍增法

核心思想

倍增法的本质是用二进制拆分来加速跳跃过程。任意一个正整数都能唯一分解为若干个不相同的 $2$ 的幂次方之和，因此在树上向上跳跃时，可以将步数按二进制分解，一次跳跃 $2^k$ 步而非一步一步走。

预处理

定义 $fa_{i,k}$ 表示节点 $i$ 向上跳 $2^k$ 步后到达的点。通过递推式：

$fa_{i,k} = fa_{fa_{i,k-1},\;k-1}$

可以在一遍 DFS 中完成所有 $fa_{i,k}$ 的计算。

查询过程

查询分为两个阶段：

对齐深度：将较深的节点向上跳，使两节点深度相同。利用二进制拆分，一次最多跳 $\log n$ 步。
同步上跳：从大到小枚举 $k$ ，若 $fa_{u,k} \neq fa_{v,k}$ 则同时上跳。最终两节点停在 LCA 的正下方，LCA 即为 $fa_{u,0}$ 。

flowchart TD subgraph 预处理 A["DFS 计算 dep[u]"] --> B["递推 fa[u][k] = fa[fa[u][k-1]][k-1]"] end subgraph 查询 C["输入 u, v"] --> D["将深度较大的 u 向上跳至与 v 同深度\n（二进制拆分）"] D --> E{"u == v?"} E -->|是| F["返回 u"] E -->|否| G["k 从大到小：若 fa[u][k] ≠ fa[v][k]，同时上跳"] G --> H["返回 fa[u][0]"] end

复杂度：预处理 $O(n \log n)$ ，单次查询 $O(\log n)$ ，空间 $O(n \log n)$ 。

评价：倍增法是竞赛中最常用的 LCA 求法，代码简洁，思想易懂，且可以方便地携带路径信息（如边权和、路径最大值），是非常通用的树上工具。缺点是常数略大，且无法做到 $O(1)$ 查询。

//参考代码
struct LCA {
 int fa[N][20], dep[N];
 
 void dfs(int u, int f) {//预处理倍增节点
 fa[u][0] = f;
 dep[u] = dep[f] + 1;
 for (int i = 1; i < 20; i++) {
 fa[u][i] = fa[fa[u][i-1]][i-1];
 }
 for (auto v : G[u]) {
 if (v != f) dfs(v, u);
 }
 }
 
 int lca(int u, int v) {//跳接点找LCA
 if (dep[u] < dep[v]) swap(u, v);
 for (int k = 19; k >= 0; k--) {
 if (dep[fa[u][k]] >= dep[v]) u = fa[u][k];
 }
 if (u == v) return u;
 for (int k = 19; k >= 0; k--) {
 if (fa[u][k] != fa[v][k]) {
 u = fa[u][k];
 v = fa[v][k];
 }
 }
 return fa[u][0];
 }
};

方法三：树链剖分（重链剖分）

核心思想

树链剖分将树按子树大小划分为若干条重链，每条重链上的节点 DFS 序连续。关键性质是：任意节点到根路径上的重链数量不超过 $\log n$ 条。

预处理

两遍 DFS：

第一遍：计算深度 dep、父节点 fa、子树大小 siz、重儿子 son。
第二遍：沿重儿子遍历形成重链，记录链顶 tp 和 DFS 序。

查询过程

只要两节点不在同一条重链上，就将链顶深度较大的节点跳到其链顶的父节点；当两节点处于同一条重链时，深度较小的即为 LCA。

flowchart TD A["输入 u, v"] --> B{"tp[u] == tp[v]?"} B -->|否| C["dep[tp[u]] < dep[tp[v]]?\n（确保 tp[u] 更深）"] C -->|是| D["swap(u, v)"] C -->|否| E["u = fa[tp[u]]"] D --> E E --> B B -->|是| F{"dep[u] < dep[v]?"} F -->|是| G["返回 u"] F -->|否| H["返回 v"]

复杂度：预处理 $O(n)$ ，单次查询 $O(\log n)$ ，空间 $O(n)$ 。

评价：虽然理论复杂度与倍增法相同，但常数往往更小（跳链比跳 $2^k$ 步更快）。树剖的真正价值在于：它不仅能求 LCA，还是树上路径修改/查询的万能数据结构，配合线段树可以处理几乎所有静态或动态的树上路径问题。

代码参见树链剖分章节：
1. HTML
2. Markdown

方法四：欧拉序 + ST 表

核心思想

对树做 DFS，每次进入节点或从子节点回溯时都记录该节点，得到长度为 $2n-1$ 的欧拉序列。一个重要性质是： $u$ 和 $v$ 的 LCA，等于它们在欧拉序中第一次出现位置之间深度最小的节点。

预处理与查询

DFS 求出欧拉序和深度序列，记录每个节点在欧拉序中首次出现的位置。
对深度序列建立 ST 表（Sparse Table），预处理 $O(n \log n)$ 。
查询时找到 $u$ 和 $v$ 首次出现位置构成的区间，用 ST 表 $O(1)$ 查询区间最小深度对应的节点。

flowchart TD subgraph 预处理 A["DFS 得到欧拉序 pot[]\n和深度序列"] --> B["记录 first[u]"] B --> C["建立 ST 表\nst[i][j] 表示从 i 开始\n长度为 2^j 的区间中深度最小的点"] end subgraph 查询 D["输入 u, v"] --> E["l = first[u], r = first[v]\n若 l > r 则交换"] E --> F["k = log₂(r - l + 1)"] F --> G["比较 st[l][k] 与 st[r-2^k+1][k]\n返回深度较小的点"] end

复杂度：预处理 $O(n \log n)$ ，单次查询 $O(1)$ ，空间 $O(n \log n)$ 。

评价：这是能做到在线 $O(1)$ 查询的经典方法，适合查询量极大且对实时性要求高的场景。但 ST 表的空间开销较大，实际运行中常数表现可能不如理论预期。

方法五：DFS 序 + ST 表（改进版）

这是欧拉序方法的变种。它利用 DFS 序（而非欧拉序）配合 ST 表，查询 $[dfn_u, dfn_v]$ 区间内深度最小的点的父节点作为 LCA（需特判 $u=v$ 和祖先关系的情况）。

复杂度：与欧拉序方法相同，预处理 $O(n \log n)$ ，查询 $O(1)$ 。

评价：这一改进使得常数比欧拉序方法更小（在洛谷模板题上仅需 869ms，甚至快于 Tarjan）。它和欧拉序方法共享同一套复杂度框架，但实际运行效率更高，是追求极致查询速度场景下的优选。

namespace st{
 int stt[maxn][40];
 int T(int a,int b){return dept[a]<dept[b]?a:b;}//此处根据实际需求更改 
 void init(int n,int a[]){
 for(int i=1;i<=n;i++)stt[i][0] = a[i];
 for(int j = 1;j <= __lg(n);j++)
 for(int i=1;i+(1<<j)-1<=n;i++)
 stt[i][j] = T(stt[i][j-1],stt[i+(1<<(j-1))][j-1]);
 }
 int find(int l,int r){
 register int s = __lg(r-l+1);
 return T(stt[l][s],stt[r-(1<<s)+1][s]);
 }
}

void dfs(int x,int dep,int f){
 dfn[x] = ++timestamp;
 dfso[dfn[x]] = x;
 dept[x] = dep;
 fa[x] = f;
 for(auto i:g[x])
 if(!dfn[i])
 dfs(i,dep+1,x);
}

int lca(int a,int b){
 if(a==b)return a;
 register int i;
 if(dfn[a]>dfn[b])i = st::find(dfn[b]+1,dfn[a]);
 else i = st::find(dfn[a]+1,dfn[b]);
 return fa[i];
}

方法六：Tarjan 离线算法

核心思想

Tarjan 算法是一种离线算法：先将所有查询读入并存储，然后通过一遍 DFS 统一回答所有询问。

算法流程

利用并查集维护节点状态（白点：未访问；红点：正在访问；黑点：已回溯）。DFS 过程中：

递归处理当前节点的所有子树。
每处理完一个子树，将该子树与当前节点合并（并查集）。
处理所有与当前节点相关的查询——若另一节点已经访问过（黑点），则两节点的 LCA 即为另一节点在并查集中的祖先。

flowchart TD subgraph Tarjan_DFS["Tarjan(u)"] A["vis[u] = 1 (红点)"] --> B["遍历所有子节点 v"] B --> C{"vis[v] == 0?"} C -->|是| D["递归 Tarjan(v)"] D --> E["合并 fa[v] = u (并查集)"] E --> B C -->|否| B B --> F["处理与 u 相关的查询 (v, id)"] F --> G{"vis[v] == 2?"} G -->|是| H["ans[id] = find(v)\n(find 返回 v 在并查集中的祖先)"] G -->|否| I["跳过"] H --> F I --> F F --> J["vis[u] = 2 (黑点)"] end

复杂度： $O(n + m \cdot \alpha(n))$ ，其中 $\alpha(n)$ 为反阿克曼函数，近似常数。

评价：整体复杂度接近线性，是所有方法中最优的。但需要离线处理（一次性知道所有查询），且并查集常数的存在使得在数据量不大时未必比 DFS 序 + ST 表快。适合查询极多且允许批量处理的场景。

方法七：分块

一种不太常见的“根号”做法：将父节点序列按 $\sqrt{n}$ 大小分块，预处理每个点跳出当前块后到达的第一个祖先。查询时交替进行“大跳”（跳块间）和“小跳”（块内跳父节点），直到两点相遇。

复杂度：预处理 $O(n\sqrt{n})$ ，查询 $O(\sqrt{n})$ 。

评价：复杂度不占优势，实际表现甚至不如暴力。其主要价值在于理论意义——它支持父节点的动态修改，这一点是倍增、树剖等方法难以做到的。适合需要同时支持“修改父节点”和“查询 LCA”的特殊题目。

总结对比

方法	预处理	单次查询	在线/离线	空间复杂度	特点
暴力	$O(n)$	$O(n)$	在线	$O(n)$	最简单，仅适合极小数据
倍增	$O(n \log n)$	$O(\log n)$	在线	$O(n \log n)$	最常用，易维护路径信息
树链剖分	$O(n)$	$O(\log n)$	在线	$O(n)$	常数小，万能树上工具
欧拉序 + ST 表	$O(n \log n)$	$O(1)$	在线	$O(n \log n)$	查询极快，空间较大
DFS 序 + ST 表	$O(n \log n)$	$O(1)$	在线	$O(n \log n)$	查询极快，常数最小
Tarjan 离线	$O(n)$	$O(\alpha(n))$	离线	$O(n+m)$	整体复杂度最优
分块	$O(n\sqrt{n})$	$O(\sqrt{n})$	在线	$O(n)$	支持动态修改父节点

选型建议

以下是不同场景下的推荐选择：

模板题 / 日常使用：首选倍增法。代码简单，思路清晰，能处理绝大多数问题。
查询量极大，追求极致速度：选DFS 序 + ST 表。在线 $O(1)$ 查询，常数表现优异。
需要同时维护树上路径：选树链剖分。不仅能求 LCA，配合线段树可以处理路径修改和查询。
允许离线，查询量极大：选Tarjan 离线算法。整体复杂度最优，接近线性。
需要动态修改树的形态：考虑分块法或 Link-Cut Tree 等动态树结构。

实际做题时，不必追求“最优”算法，而应根据题目的数据范围、操作类型和实现难度选择最合适的工具。大多数情况下，倍增法和树链剖分已经足够覆盖需求。

菜单

分享

最近公共祖先 LCA

最近公共祖先 LCA

什么是 LCA

方法一：暴力跳父节点

方法二：倍增法

核心思想

预处理

查询过程

方法三：树链剖分（重链剖分）

核心思想

预处理

查询过程

方法四：欧拉序 + ST 表

核心思想

预处理与查询

方法五：DFS 序 + ST 表（改进版）

方法六：Tarjan 离线算法

核心思想

算法流程

方法七：分块

总结对比

选型建议

评论

__gnu_pbds 扩展库

STL 标准模板库

__gnu_cxx 扩展库

P2827 [NOIP 2016 提高组] 蚯蚓

P7077 [CSP-S 2020] 函数调用

P2114 [NOI2014] 起床困难综合症

P1553 数字反转（升级版）

P1593 因子和

P1879 [USACO06NOV] Corn Fields G

丢番图方程（一元不定方程）