图的基本性质和操作

Graph 是非常重要而又涵盖很广的内容,以至于有单独的 “图论” 研究方向。LeetCode 上很多问题都可以抽象成 “图” ,比如搜索类问题,树类问题,迷宫问题,矩阵路径问题,等等。

  • BFS 的时间空间占用以 branching factor 为底, 到解的距离 d 为指数增长;空间占用上 Queue 是不会像 DFS 一样只存一条路径的,而是从起点出发越扩越大,因此会有空间不够的风险,空间占用为 O(b^d)。

  • DFS 的时间占用以 branching factor 为底,树的深度 m 为指数增长;而空间占用上,却只是 O(bm),可视化探索过程中只把每个 Node 的所有子节点存在 Stack 上, 探索完了再 pop 出来接着探,因此储存的节点数为 O(bm)。

可以看到无论是 BFS 还是 DFS,树的 branching factor 都是对空间与时间复杂度影响最大的参数;除此之外,BFS 中最重要的是到解的距离,而 DFS 看从当前节点的深度。普遍来讲,DFS 空间上会经济一些,当然也要分情况讨论。


Topological sort,拓扑排序,是 graph 搜索中一种特殊的顺序,本质上还是完全可以靠 BFS / DFS 解决。

有向图 DFS 图示:

有向图 BFS 图示:


有向图 Directed:

  • DFS:

    • Detect Cycle (Course Schedule)

      暴力解法:DFS + Backtracking,寻找“所有从当前节点的” path,如果试图访问 visited 则有环;缺点是,同一个点会被探索多次,而且要从所有点作为起点保证算法正确性,时间复杂度非常高

      最优解法是 CLRS 上用三种状态表示每个节点:

      • "0" 还未访问过;
      • "1" 代表正在访问;
      • "2" 代表已经访问过;

      DFS 开始时把当前节点设为 "1";

      在从任意节点出发的时候,如果我们试图访问一个状态为 "1" 的节点,都说明图上有环。

      当前节点的 DFS 结束时,设为 "2";

      在找环上,DFS 比起 BFS 最大的优点是"对路径有记忆",DFS 记得来时的路径和导致环的位置,BFS 却不行。

    • Topological Sort

      类似剥洋葱,可以选择任意点开始向里 DFS ,记录path,后面做的其他 DFS path 都放在之前结果的前面。(CLRS有)

      等价做法是,把每次 DFS 探索中的 path 按照由内向外的顺序添加(单序列反序), 后进行的 DFS 结果放在之前运行完的结果后面(全序列反序),然后 reverse 就好了,可以改良 ArrayList 添加的时间复杂度。

      更简单的做法是用 Java 内置的 LinkedList,支持双端操作。

    • Count # of connected components

    • Determine if A is reachable from B

  • BFS:

    • Detect Cycle (Course Schedule)

      首先,在 DAG 上找环,DFS 要比 BFS 强。

      其次重点注意,有向图靠 3 个状态 BFS 是不能正确判断是否有环的,要靠 indegree,一个例子是 【0, 1】 和 【1,0】,环在发现之前已经被标注为 state 2 了。

      扫一遍所有 edge,记录每个节点的 indegree.

      在有向无环图中,一定会存在至少一个 indegree 为 0 的起点,将所有这样的点加入queue。

      依次处理queue里的节点,把每次poll出来的节点的 children indegree -1. 减完之后如果 child 的 indegree = 0 了,就也放入队列。

      如果图真的没有环,可以顺利访问完所有节点,如果还有剩的,说明图中有环,因为环上节点的 indegree 没法归 0.

    • Topological Sort

      步骤同上,扫的时候按顺序 append 就好了。

      类似于“剥洋葱”,从最外面一层出发,逐步向里。

    • Count # of connected components

    • Determine if A is reachable from B

      这个任务最适合用 BFS 做,从 B 做起点一路扫看看能不能扫到 A 就行了。


无向图 Undirected:

无向图算法的整体思路和有向图基本一致,但是需要重点注意 正确处理 “原路返回” 的情况,免得死循环或者误报。

在无向图的2个状态基础上增加一个 “正在访问” 的新状态,加上注意 prev 就可以了。

  • DFS:

    • Detect Cycle (Graph Valid Tree)

      用 int[] 表示每个点的状态,其中

      • 0 代表“未访问”;
      • 1 代表“访问中”;
      • 2 代表“已访问”;

      DFS call 里要传入 "prev节点" 参数,避免出现原路返回,或者回到前一个节点误判为有环。(和 directed graph DFS 唯一的不同之处)

      其他情况下,如果我们试图访问一个状态为 “1” 的节点,都可以说明图中有环。

    • Count # of connected components (Graph Valid Tree)

    • Determine if A is reachable from B

  • BFS:

    • Detect Cycle (Graph Valid Tree)

      扫描所有 edges 记录图到底长啥样;

      用 "0,1,2" states;

      随便扔一个点进 queue,标记 "1",然后 BFS,所有 child = "0" 的都加入队列

      所有 child 都检查完之后,立刻把当前 node = 2,不然下一层 BFS 会回头去看自己然后误报。

      如果遇到 child = "1" 的说明有环

    • Count # of connected components (Graph Valid Tree)

      和 Detect Cycle 一样,同时记录下到底做了几次 BFS 才扫遍全图,图上就有几个 connected components

    • Determine if A is reachable from B

      BFS 搜到底看看能不能到就可以了,这个和只靠 g(x) 的 uniform-cost search 一致。

results matching ""

    No results matching ""