PostgreSQL 面试高频问答（结构化版）

1) PostgreSQL 和 MySQL 最大的区别是什么？

对比

维度	PostgreSQL	MySQL(InnoDB)
MVCC	行版本 + `xmin/xmax` + 快照	undo log + Read View
索引	B-tree/GIN/GiST/BRIN/SP-GiST 等	主流 B+Tree
JSON	`JSONB` 强，支持 GIN	有 JSON，但高级能力通常弱于 PG
约束与标准	更严格、更完整	历史上更宽松
扩展	强（PostGIS 等）	相对弱

怎么用

回答时先给结论，再给“场景化选型”：复杂查询/强一致/JSONB/地理空间选 PG；简单高并发 CRUD 且团队 MySQL 经验深可选 MySQL。

优化/坑

别说“PG 一定比 MySQL 快”。数据库选型本质是业务、团队、数据模型、成本的平衡。

场景

电商交易核心、风控、报表分析、地理空间、文档+关系混合查询，更常见 PG 优势。

2) PostgreSQL 的 MVCC 实现原理是什么？

定义

MVCC（多版本并发控制）是 PostgreSQL 实现“数据隔离（事务隔离级别）”的核心机制：同一行在不同时间可存在多个版本，事务通过快照规则决定“当前能看见哪个版本”，从而在并发场景下既控制可见性（隔离），又尽量做到读写不互相阻塞。

核心实现原理

可以把一行数据理解为“有生命周期的版本记录”，而不是可反复擦写的单元格。MVCC 的关键是：同一业务行可同时存在多个物理版本，查询通过快照决定可见版本。

行级元信息：每个物理版本隐含 xmin（创建该版本的事务 ID）与 xmax（使该版本失效的事务 ID）。通常 xmax=0 表示该版本尚未失效。
UPDATE 的本质：更新不会原地覆盖，而是把旧版本标记失效（写入 xmax），再插入新版本（新行 xmin 为当前事务）。因此对于这一行数据来说，旧物理版本的 xmax 等于新物理版本的 xmin。它们都指向执行更新操作的那个事务 ID。因此同一时刻磁盘上可能并存新旧两版。
快照：快照主要由三个核心元素组成：
- xmin：这是快照生成时，最早的、仍在运行的事务 ID。所有比它小的事务都已经提交了，它们产生的数据对你可见。
- xmax：这是快照生成时，系统即将分配的下一个事务 ID。所有大于等于它的事务在快照生成时都还没出生，它们产生的数据对你不可见。
- xip_list：这就是你说的正在运行的事务 ID 列表。这些事务 ID 介于 xmin 和 xmax 之间，但它们还没提交，所以它们改动的数据对你不可见。
定位最新且合法的版本：数据库会沿着同一行的版本链寻找那个 xmin 最大（最年轻）且 xmax 无效（还没死）的版本，选出“对当前快照可见且事务号最新”的那个版本。

可见性判定坐标轴

隔离级别

读未提交
字面上允许读到别人还没提交的数据（脏读）。但在 PostgreSQL 中，这个级别会被按 读已提交 执行。

根因是 PG 读取某个版本时，会基于该版本的事务号去查事务状态（提交/回滚/运行中）以及当前快照的活跃事务列表。如果该事务状态还在运行中/回滚则直接判定该物理行版本不可见，只要创建者事务提交，这个物理行版本才可见。

所以 PG 不是“默认不脏读”，而是“机制上无法脏读”。
读已提交
核心是“语句级快照”：每条 SQL 开始前都重新获取快照。

同一事务内，两次相同查询之间若有其他事务提交更新，第二次可能读到新值（不可重复读）；范围查询也可能出现幻读。
可重复读
核心是“事务级快照”：事务第一条查询确定快照，后续所有查询都复用同一张快照。

先区分两个概念：不可重复读关注“同一行内容变了”；幻读关注“满足条件的行数变了（结果集多/少了）”。

在RR下，外部事务在你快照之后新插入的行，其 xmin 不在你的可见范围内；外部事务删除的影响也不会改变你这张快照看到的结果集，所以同条件范围查询的行数保持一致。

因此 PG 的 RR 不仅避免不可重复读，也能避免幻读

但 RR 仍可能出现更高阶的并发逻辑冲突（如写偏序），并发更新时也可能报错，需要应用做事务重试。

为什么 PostgreSQL 天然免疫脏读

事务 A 更新时会产生新版本；在 A 提交前，新版本创建事务状态是“运行中”。
事务 B 读取时，发现该版本创建者未提交，直接判定不可见；只能看到旧版本。
如果 A 最终回滚，新版本状态变为“已回滚”，依然不可见。
只有当状态为事务“已提交”，并且同时通过以下快照规则时，版本才可见：
- 规则 1：创建者事务必须是已提交；若是运行中或已回滚，直接不可见。
- 规则 2：若该版本的事务号小于快照下界（snapshot.xmin），它属于拍照前已稳定完成的数据，通常可见。
- 规则 3：若事务号落在 snapshot.xmin 与 snapshot.xmax 之间，需检查是否在快照活跃事务列表中：
  - 在列表中：拍照时仍未完成，不可见；
  - 不在列表中：拍照时已完成，可见。
- 附加条件（未被删）：还要检查该版本的 xmax 是否已生效删除；若删除已生效，则该版本依然不可见。

并发异常对照

隔离级别	脏读	不可重复读	幻读	序列化异常	是否默认
Read Uncommitted	不可能	可能	可能	可能	否（等同 RC）
Read Committed	不可能	可能	可能	可能	是
Repeatable Read	不可能	不可能	不可能	可能	否

3) 什么是 vacuum 和 autovacuum？它们分别解决什么问题？

定义

可以把 VACUUM 理解为pg里的“垃圾回收 + 空间管理员”。在 Pg 中，DELETE / UPDATE 不会立刻物理删行，会留下大量失效行记录。VACUUM 负责清理这些历史版本；autovacuum 则是自动执行这件事的后台机制。

为什么需要

表膨胀：失效行记录长期堆积，表文件越来越大。
查询变慢：扫描时会碰到大量无效版本，I/O 与缓存压力升高。
统计失真：优化器拿到过期统计信息后，容易选错执行计划。

两种形态

类型	做了什么	锁影响	空间结果	适用场景
VACUUM（普通，在线清理）	扫描表并识别失效行记录，把对应位置标记为“可复用空位”；常与 ANALYZE 配合，更新统计信息	通常不阻塞正常读写（业务可继续）	主要是数据库内部复用空间，不一定立刻缩小文件，不一定归还操作系统	日常维护主力；高频 UPDATE/DELETE 表的常规治理
VACUUM FULL（离线重组）	重写整表：把存活数据搬到新文件，再替换旧文件	会锁全表，期间读写受明显影响	可显著缩小文件体积，并把空间归还操作系统	表极度膨胀、且有明确维护窗口时使用（非日常）

细节

先产生“历史版本”（失效行记录）：
- DELETE 只是标记失效，不会立刻物理删除。
- UPDATE 是“写新版本 + 旧版本失效”，旧版本会短期保留。
普通 VACUUM 的核心动作：
- 先确认“逻辑上已死亡”：检查该版本的 xmax 对应事务是否已提交。若删除事务仍在运行或已回滚，这个版本还不能算真正失效，不能清理。
- 再确认“历史上无人再需要”：即使 xmax 已提交，也要确认系统中不存在更早开启且仍活跃的事务快照会看到它。只有当“最后一个可能读取它的旧快照”也结束后，这个版本才会被标记为空位可复用。
- 长事务危险：长事务会长期占用很小的事务号下界，使清理进程不敢回收大量已失效版本，最终造成本堆积与表膨胀。
- 举例：事务 A（ID=90）长时间不结束；事务 B（ID=100）删除了一条梦境并提交，行上出现 xmax=100。此时新事务 C（ID=110）快照即活跃事务列表已经看不到该事务，但因为 A 的旧快照仍可能看到它，清理进程不能回收。只有当 A 结束后，这条记录才会被标记为可复用空位。
为什么文件有时不变小：
- 普通 VACUUM 主要做“库内复用”，不是重写整表。
- 要显著缩文件并归还系统空间，通常需要 VACUUM FULL。

autovacuum 做什么

autovacuum 是 PostgreSQL 的后台自动清理机制：按表改动量与失效行记录阈值自动触发 VACUUM，并在统计信息老化时触发 ANALYZE，保证“空间可复用 + 执行计划更准确”。

怎么用

默认开启 autovacuum，不建议关闭。
VACUUM FULL 仅在严重膨胀且有维护窗口时执行。

4) PostgreSQL 支持哪些索引？B-tree 之外常用哪些？各自使用场景？

定义

索引就像书本目录：没有索引时，数据库常要“从头翻到尾”（全表扫描）；有索引后可以更快定位目标数据。

常见索引类型与场景

B-tree（默认首选）：
- 支持：=、>、<、BETWEEN、排序、前缀匹配（如 LIKE 'abc%'）。
- 适合：主键/唯一键、时间范围、金额范围、常规筛选排序。
- 结论：大多数业务先考虑它。

B-tree 结构图 1：等值查询

B-tree 结构图 2：范围查询（24~28）

B-tree 结构图 3：插入触发页分裂（Page Split）机制

点击查看注释：为什么父节点（内部节点）也会满，以及级联分裂如何影响树高

核心结论：父节点（Parent Node）就是非叶子节点（内部节点/路由节点）。它虽然不存行地址 TID，但它同样是固定大小的 8KB 物理页，所以也会“装满”。

1) 非叶子节点内部结构：为什么“指示牌”也会挤满

叶子节点主要存 (Key, TID)：Key + 数据行物理地址。
非叶子节点主要存 (Key, Child_Page_Number)：Key + 下层页号（路由信息）。
可理解为“分流表”：不同 Key 把查询分流到不同子页。
因为页大小固定为 8KB，Key 越大，单页可容纳的分流项越少；分流项增多后，父节点同样会满。

2) 级联分裂（Cascade Split）：从叶子一直向上推

叶子页先满：页 A 分裂成 A/B，并把中间键（如 25）上推给父节点。
父节点也可能满：若父节点放不下这个新分流键，就继续分裂，并把自己的中间键再上推。
最坏会影响根：若根也满，根分裂并生成新根，整棵树高度 +1。

3) 为什么要关注树高

树高几乎直接决定查找路径长度。高度从 3 增到 4，等值查找通常就要多经过一层节点，在高并发下会放大延迟与 I/O 压力。

4) 补充：分裂策略与写入模式

PostgreSQL 常见 90/10（偏顺序插入优化）或 50/50（偏随机插入）分裂思路，目标是留出一定空隙（fillfactor）减少频繁再分裂。随机生成的 UUID 做主键会让数据库变慢：因为 UUID 乱序，会导致整棵树到处都在频繁分裂、频繁重组。

一句话总结

父节点不存业务数据，但要存“路标”；路标多了，8KB 的页照样不够用，分裂就会沿树向上级联。

GIN（倒排）：
- 特点：索引“元素”，不是整行，适合多值/包含关系查询。
- 适合：JSONB、数组、全文检索（梦境关键词检索）。
- 代价：写入维护成本通常高于 B-tree。
BRIN（块范围索引）：
- 特点：按数据块记录最小/最大值，索引体积极小。
- 适合：超大时序表、按时间递增写入的日志/流水。
- 优势：写入影响小，空间成本低；但精确度不如 B-tree。

总结对照

索引类型	核心优势	Dream Log 典型场景
B-tree	通用、有序、范围查询强	用户 ID、创建时间、常规筛选排序
GIN	包含/多值/全文检索强	梦境内容关键词、标签、JSONB 属性
BRIN	体积极小，适合海量时序	日志流水、按时间追加的大表

优化/坑

索引不是越多越好：每多一个索引，写入都要额外维护。应基于真实 SQL、选择性与命中率定期清理无效索引。

5) 解释一下 PostgreSQL 中的 WAL 机制，它的作用是什么？

0) 先看一个“没有 WAL 会怎样”的场景

假设 Dream Log 正在执行一条 UPDATE。数据库先在内存修改数据，然后准备把对应的 8KB 数据页写回磁盘。就在写盘过程中突然断电：可能只写了 2KB，剩余 6KB 没写完，形成“部分写入”。重启后这个数据页可能不一致，严重时会影响实例恢复。

WAL（Write-Ahead Logging，预写式日志）就是为了解决这个矛盾：既要提交快，又要崩溃后可恢复。

1) WAL 的核心铁律：先写日志，再让数据页落盘

规则：任何数据页写入磁盘之前，描述该变更的 WAL 记录必须先安全落盘。

客户端发出 UPDATE，数据库先修改内存中的 Buffer Cache（脏页产生）。
生成 WAL 记录（例如：事务100把 Page 42 的第 7 行改为“醒了”）。
把 WAL 追加写入 WAL 文件，并在提交路径上完成刷盘确认（fsync）。
WAL 落盘成功后，事务即可返回“提交成功”。
真正的 8KB 数据页可由后台进程稍后异步刷盘。

2) WAL 解决了什么问题（3 大作用）

A. 崩溃恢复（Crash Recovery）

宕机后内存全部丢失，数据页可能还没来得及落盘。重启时 PostgreSQL 会从最近 Checkpoint 往后重放 WAL（Redo），把“已经提交但尚未写入数据页”的变更补回去，恢复到一致状态。

B. 性能优化：把随机写变成顺序写

直接写数据页通常是随机 I/O，成本高；而 WAL 是连续追加写（顺序 I/O），吞吐和延迟都更稳定。所以提交路径优先保证 WAL 快速落盘，接口响应更快。

C. 复制与时间点恢复（PITR）

主从复制：从库持续接收并重放主库 WAL，即可与主库保持一致。
PITR：“一份基础备份 + 一段时间内的 WAL”，可恢复到指定时间点（秒级）。

3) Checkpoint：为什么 WAL 不会无限增长

Checkpoint 会定期把脏页批量推进到数据文件，并在 WAL 中写入检查点记录。这样崩溃恢复只需从最近 Checkpoint 开始，不必从很久以前回放；同时更早的 WAL 也具备回收/复用条件。

4) 一张图看懂 WAL

6) EXPLAIN ANALYZE 执行计划？

定义：EXPLAIN 是“预测”，EXPLAIN ANALYZE 是“实测”

EXPLAIN 只展示优化器预计会怎么执行；EXPLAIN ANALYZE 会把 SQL 真正跑一遍，输出每个节点的真实耗时、真实行数与循环次数。

1. 先看扫描方式：

扫描类型	含义	面试解读
`Seq Scan`	全表顺序扫描	小表可接受
`Index Scan`	先查索引，再回表取数据	适合选择性高（返回行少）的条件查询
`Index Only Scan`	仅靠索引返回结果，不回表	理想状态，I/O 最省，通常依赖覆盖索引与可见性条件

2. 核心指标：

A. `actual time`（真实耗时）

B. `rows`（估算行数）vs 实际行数

需用 EXPLAIN (ANALYZE, BUFFERS)。重点看 shared hit（缓存命中）与 shared read（磁盘读取）。read 持续偏高通常意味着慢 I/O 成本在放大。

3. 常见性能瓶颈

索引失效：例如在过滤列上套函数（如 WHERE lower(title)=...），导致已有索引无法直接使用，计划退化为 Seq Scan。
Nested Loop 地狱：大表 join 大表但仍走嵌套循环，常因 join 键缺索引或行数估算错误，原本应选 Hash Join/Merge Join。
排序落盘：出现 Sort Method: external merge Disk，说明排序集超出内存，转为磁盘排序，延迟明显上升。
重复扫描放大：某节点 loops 很高，单次不慢但总耗时被循环放大，常见于不合理子查询或 join 顺序。

4. 建议的排查顺序（实战模板）

看 Execution Time：总耗时是否超预算。
找最慢节点：按 actual time 与 loops 定位热点。
看扫描类型：大表是否出现异常 Seq Scan。
对比行数：估算与实际是否严重偏差。
看 Buffers：慢点是 CPU 计算还是磁盘 I/O。

7) PostgreSQL 如何实现分区表？

1. 什么是分区表

父表是逻辑入口，本身不存业务数据；真正数据落在分区子表（Partitions）里。你对父表执行 SELECT/INSERT，PostgreSQL 会自动路由到对应分区。

2. 三种核心分区方式

类型	适用场景	Dream Log 示例	特点
RANGE	时间/数值区间数据	按 `created_at` 按月或按年分区	最常见；范围查询可触发分区裁剪
LIST	枚举/分类字段	按 `weather_tag` 分区	分类清晰时直观易维护
HASH	无明显范围但要均摊负载	按 `user_id` 哈希打散	均衡写入与并发压力

分区路由与裁剪流程图

实践坑点：分区不是越多越好；若分区键（created_at）和主查询条件（user_id）不一致，分区裁剪不会触发，数据库会将所有子表都扫描一遍，这比不分区还要慢！因为扫描多个物理表的开销远大于扫描一个大表。建议配置 DEFAULT PARTITION 防止异常值插入失败。

8) JSON 和 JSONB 的区别？

核心结论

在 PostgreSQL 17 里，两者都能存 JSON，但定位不同：JSON 是“原样文本存档”，JSONB 是“可计算、可索引的二进制结构”。

1. 核心区别对比

特性	JSON	JSONB
存储方式	保存原始文本副本	写入时解析为二进制结构
写入开销	较低（几乎直接写入）	较高（需解析与结构化）
查询速度	较慢（查询时再解析）	更快（已预解析）
索引能力	弱	强（常配合 GIN）
键顺序/重复键	保留输入顺序与重复键	不保证原顺序，重复键按规则归并（保留后值）
典型定位	“原文存档”	“可检索的数据结构”

2. 为什么 JSONB 常是首选

查询友好：可直接对键路径做过滤、聚合与包含判断。
索引友好：GIN 索引能显著降低大数据量下的 JSON 查询成本。
计算友好：写入时先解析，读取时少重复解析，整体更适合“经常查”的业务。

3. 什么时候选 JSONB，什么时候选 JSON

A. 选 JSONB（绝大多数场景）

需要按 JSON 内部字段过滤，如 WHERE data->>'type'='dream'。
需要统计、聚合、标签检索、报表分析。
不要求保留原始文本格式（空格缩进等）。

B. 选 JSON（少数场景）

只做“原样存取”，几乎不查询内部字段。
必须保留原始格式或重复键形态。
极端偏写入、极低读取频率的日志存档场景。

实践提醒：JSONB 虽灵活，但不要把所有结构化字段都塞进 JSONB。高频筛选字段（如 user_id、created_at、status）仍应保留为普通列，便于优化器稳定选计划。

9) 说说 PostgreSQL 的进程模型

核心结论：PostgreSQL 17 是多进程模型（Process-Based）

PostgreSQL 采用“多进程”而不是“多线程”架构。优点是稳定性强：单个进程异常通常不会直接拖垮整个实例，主控进程可感知并进行隔离处理。

1) Postmaster（主控/守护进程）

实例启动后首先运行的是主控进程（常见为 postgres）。它不直接执行业务 SQL，而是负责：

监听连接端口（默认 5432）；
接收新连接并派生对应的 backend 进程；
管理共享内存与各类后台辅助进程生命周期。

2) Backend

每个客户端连接（例如 Dream Log 的一次应用连接）都会对应一个独立 backend，负责该连接上的 SQL 全流程：

解析 SQL、生成/执行计划；
访问 shared buffers、锁管理、事务执行；
必要时触发 WAL 记录与提交路径同步。

关键代价：“每连接一进程”意味着连接数暴涨会迅速放大内存与调度开销，生产环境通常需要 PgBouncer 做连接池化。

点击查看

PgBouncer 是什么，为什么几乎必备？

PgBouncer 是 PostgreSQL 生态里轻量级高性能连接池。它把“海量客户端连接”复用到“少量真实数据库连接”，直接缓解 PostgreSQL 多进程模型下的连接膨胀问题。

1) 不用 PgBouncer 的痛点

每个连接都要对应一个 backend 进程，内存与调度开销线性上升。
高并发下会出现连接风暴、上下文切换增加、数据库吞吐抖动。

2) PgBouncer 的三种池化模式

Session Pooling：连接随会话独占，最兼容但复用效率一般。
Transaction Pooling（最常用）：连接在事务内借出，提交后立即归还，复用率最高。
Statement Pooling：每条语句后归还连接，不支持多语句事务，较少用于通用业务。

3) Dream Log 的直接收益

连接创建更快：客户端连接由 PgBouncer 预热复用。
内存更稳：数据库真实连接数可控，不随前端连接暴涨。
抗峰值更强：数据库进程数与负载更平滑。

3) 辅助进程

进程	职责	你可以怎么理解
Logger	写运行日志与错误日志	日志员
Checkpointer	执行检查点，推进脏页落盘边界	检查点总管
Background Writer	平时预刷脏页，维持可用缓冲页	异步刷盘手
WAL Writer	把 WAL buffer 持续刷新到 WAL 文件	日志记录员
Autovacuum Launcher/Worker	自动回收 dead tuples、维护统计信息	垃圾回收队
Archiver	归档已完成的 WAL 段	档案员
Walsender/Walreceiver	复制链路日志传输与接收	同步专员

4) 共享内存：多进程如何协作

PostgreSQL 的并发进程通过共享内存协同工作，而不是直接共享进程私有堆：

Shared Buffers：共享数据页缓存；
Lock/Proc 相关结构：协调锁与进程并发控制；
WAL Buffers：暂存尚未写入 WAL 文件的日志记录。

5) 结合 Dream Log 的一次查询链路

FastAPI 发起连接/请求，Postmaster 受理连接；
对应 backend 执行 SQL，优先从 shared buffers 取页；
写请求产生 WAL；WAL Writer、bgwriter、checkpointer 在后台配合保障性能与可恢复性。

进程模型架构图（SVG）

10) PostgreSQL 物理复制和逻辑复制区别？

核心理解：物理复制是“搬砖头”，逻辑复制是“搬图纸”

在 PostgreSQL 17 中，两者都基于 WAL，但目标完全不同：物理复制追求“整实例一致镜像”，逻辑复制追求“按业务选择性分发”。

1) 物理复制（Physical Replication）

复制单位：整个数据库实例（所有库、表、索引、角色、系统对象）。
工作方式：主库发送 WAL 字节流，从库在对应物理页位置重放，形成“克隆体”。
从库能力：常见 Hot Standby（可读不可写）。
版本要求：主从通常要求同大版本且体系结构兼容。
优势：链路短、开销低、故障切换路径成熟，最适合 HA/容灾。

2) 逻辑复制（Logical Replication）

复制单位：可按库/表/分区/行过滤（Publication/Subscription）。
工作方式：把 WAL 解码成行级变更（INSERT/UPDATE/DELETE）后再应用。
订阅端能力：目标库是独立可写实例，可有自己的索引与额外表。
版本能力：更适合跨大版本迁移与异构分发。
优势：按需同步、解耦主库、方便构建报表库/数据集成链路。

3) 核心差异对比（面试高频）

维度	物理复制（Physical）	逻辑复制（Logical）
同步粒度	实例级（全量）	按需（库/表/行）
底层依据	WAL 物理字节/页面变更	WAL 解码后的行级逻辑变更
从端写入	通常只读	可读可写（独立库）
跨版本	弱（通常需同大版本）	强（常用于平滑升级）
索引与约束	天然一致，无需重复建	需在目标端准备结构与约束策略
性能开销	更低	更高（解码 + 应用）
典型用途	高可用、容灾、只读扩展	数据分发、跨版本迁移、分析库

4) Dream Log 该怎么选

高可用优先：主链路先上物理复制，保证主库故障时可快速切换。
分析/集成场景：把公开梦境、特定业务表用逻辑复制分发到分析库，避免压主库。

5) PG 17 可说的增强点

逻辑复制在故障切换协同、初始复制效率等方面持续增强，运维可用性更高。
复制链路在高负载下的稳定性与可观测性持续改进，更适合复杂生产拓扑。

一句话总结：物理复制是“影子”，追求一模一样；逻辑复制是“分身”，只同步你指定的数据与变更。

PostgreSQL 面试高频问答（从高频到低频）

对比

怎么用

优化/坑

场景

定义

核心实现原理

可见性判定坐标轴

隔离级别

为什么 PostgreSQL 天然免疫脏读

并发异常对照

定义

为什么需要

两种形态

细节

autovacuum 做什么

怎么用

定义

常见索引类型与场景

B-tree 结构图 1：等值查询

B-tree 结构图 2：范围查询（24~28）

B-tree 结构图 3：插入触发页分裂（Page Split）机制

1) 非叶子节点内部结构：为什么“指示牌”也会挤满

2) 级联分裂（Cascade Split）：从叶子一直向上推

3) 为什么要关注树高

4) 补充：分裂策略与写入模式

一句话总结

总结对照

优化/坑

0) 先看一个“没有 WAL 会怎样”的场景

1) WAL 的核心铁律：先写日志，再让数据页落盘

2) WAL 解决了什么问题（3 大作用）

A. 崩溃恢复（Crash Recovery）

B. 性能优化：把随机写变成顺序写

C. 复制与时间点恢复（PITR）

3) Checkpoint：为什么 WAL 不会无限增长

4) 一张图看懂 WAL

定义：EXPLAIN 是“预测”，EXPLAIN ANALYZE 是“实测”

1. 先看扫描方式：

2. 核心指标：

A. actual time（真实耗时）

B. rows（估算行数）vs 实际行数

3. 常见性能瓶颈

4. 建议的排查顺序（实战模板）

1. 什么是分区表

2. 三种核心分区方式

分区路由与裁剪流程图

核心结论

1. 核心区别对比

2. 为什么 JSONB 常是首选

3. 什么时候选 JSONB，什么时候选 JSON

A. 选 JSONB（绝大多数场景）

B. 选 JSON（少数场景）

核心结论：PostgreSQL 17 是多进程模型（Process-Based）

1) Postmaster（主控/守护进程）

2) Backend

PgBouncer 是什么，为什么几乎必备？

1) 不用 PgBouncer 的痛点

2) PgBouncer 的三种池化模式

3) Dream Log 的直接收益

3) 辅助进程

4) 共享内存：多进程如何协作

5) 结合 Dream Log 的一次查询链路

进程模型架构图（SVG）

核心理解：物理复制是“搬砖头”，逻辑复制是“搬图纸”

1) 物理复制（Physical Replication）

2) 逻辑复制（Logical Replication）

3) 核心差异对比（面试高频）

4) Dream Log 该怎么选

5) PG 17 可说的增强点

A. `actual time`（真实耗时）

B. `rows`（估算行数）vs 实际行数