Bin log、Redo log 和 Undo log 的区别,是 MySQL 的高频面试题,大厂校招面试90%会问。
在 MySQL 数据库中,Bin log、Redo log 和 Undo log 都是极为重要的日志文件。
MySQL 实现事务、崩溃恢复、集群的主从复制等,底层都离不开日志,可以说日志是 MySQL 的内核所在。
只有了解 MySQL 日志,才算是彻底搞懂 MySQL。
本文主要探讨 Bin log、Redo log 和 Undo log 的区别。
大家好,我是爱分享的程序员宝妹儿,分享即学习。
PS.
宝妹儿已将这个题目以及答案,整理到2023版《MySQL 大厂高频面试题大全》PDF了,方便系统学习、面试通关。
宝妹儿精编的2023版《MySQL 大厂高频面试题大全》,已收录100+道真题,近30000字,长期迭代、持续更新。吃透它,应付MySQL面试没问题。
公号Java面试题宝,自取。
1. Bin log、Redo log 和 Undo log 的概述
先来分别了解下它们的基本概念。
1.1 Bin log
Bin log 记录的是逻辑日志,它以追加的方式记录数据库的修改操作,采用二进制格式进行存储。
Bin log 包含了操作语句、或语句集合的原始二进制数据,可以通过解析和回放 Bin log,来重新执行其中的操作。
Bin log 的作用:
- 数据恢复和故障恢复:通过分析和回放 Bin log,可以将数据库恢复到故障发生之前的状态。当数据库发生故障或数据丢失时,可以利用Bin log 进行数据恢复。
- 主从复制:在主从架构中,Bin log 用于同步主数据库的数据变更到从数据库。主数据库将其修改操作记录到 Bin log 中,从数据库通过解析和应用 Bin log 来复制主数据库的数据变更,从而保持主从数据的一致性。
- 数据备份:通过定期备份 Bin log,可以实现对数据库的增量备份。将备份的 Bin log 文件与全量备份结合使用,可以还原数据库到指定的时间点。
示例:
假设我们有一个名为
products
的商品表,其中包含商品的名称和价格。现在,我们发现商品价格发生了错误的修改,并且需要通过 Bin log 记录来定位和修复这个问题。
假设商品 ID 为 1 的商品价格,被错误地修改为 2000。
UPDATE products SET price = 2000 WHERE id = 1;
通过查看 Bin log 记录,我们可以定位到这个修改操作,并通过恢复正确的价格来修复数据。
Bin log 的三种日志格式
针对不同的应用场景,Binlog 推出了三种工作模式 Statement、Row、Mixed,以满足对数据库的需求。
这三种模式的选型参考思路:
- 使用 MySQL 特殊功能较少,例如存储过程、触发器、函数等,用 Statement 模式。
- 使用 MySQL 特殊功能较多,用 Mixed 模式。
- 使用 MySQL 特殊功能较多,同时希望数据最大化一致,用 Row 模式。
什么时候写入 Bin Log ?
Bin Log 采用预写日志 WAL,即先写日志,再写磁盘。
写入 Bin Log 之后的事务流程:
先写处于 prepare 状态的 Redo Log,事务提交后,再写处于 commit 状态的 Redo Log,即二阶段提交。
那为什么不直接持久化到磁盘呢?
直接写入磁盘会严重影响到性能:
- InnoDB 在磁盘中存储的基本单元是页,可能本次修改只变更一页中几个字节,但是需要刷新整页的数据,就很浪费资源。
- 一个事务可能修改了多页中的数据,页之间又是不连续的,就会产生随机IO,性能更差。
在使用 Bin log 时,需要注意:
- Bin log 的开启和配置:需要确保 Bin log 已经开启,并根据实际需求配置相关参数,如 Bin log 格式、Bin log 大小和保留时间等。
- 定期备份 Bin log :为了保证数据恢复和故障恢复的能力,需要定期备份 Bin log 文件。
1.2 Redo log
Redo log 以循环写入的方式记录数据库的修改操作,采用固定大小的物理日志文件进行存储。
Redo log 记录了数据库页的物理修改,而非语句级别的逻辑操作。
Redo log 的作用:
- 保证事务的持久性:通过将事务的修改操作记录到 Redo log 中,可以确保在系统故障或崩溃发生时,已提交的事务能够被正确地重新执行,保证数据的一致性。
- 减少磁盘IO操作:Redo log的写入是顺序追加的方式,相比于随机写入数据库文件,它可以减少磁盘IO的操作,提升数据库的性能。
- 数据库恢复和故障恢复:通过分析和应用 Redo log,可以将数据库恢复到故障发生之前的状态。
- 数据库性能优化:合理配置 Redo log 的大小和数量,可以根据系统负载和事务处理量来提升数据库的性能。
示例:
假设用户在下订单后,数据库发生了突然的崩溃,我们可以使用 Redo log 来恢复用户的订单信息。
-- 在事务中创建订单 BEGIN; INSERT INTO orders (user_id, product_id, quantity) VALUES (1, 100, 2); COMMIT;
如果数据库发生崩溃,可以使用 Redo log 中的内容重新应用这个事务,恢复用户的订单信息。
啥时候写入 Redo log 呢?
Redo log 同样采用预写日志 WAL 的方式。
在使用 Redo log 时,需要注意:
- Redo log 的大小和数量配置:根据实际需求和系统负载,配置合适的Redo log大小和数量,以确保足够的持久化能力和性能。
- 定期刷写 Redo log :为了保证已提交的事务能够及时写入磁盘,需要配置合理的 Redo log 刷写策略,以避免数据丢失。
- 监控 Redo log 的使用情况:定期监控 Redo log 的使用情况,以便及时调整配置参数,并确保数据库的可靠性和性能。
1.3 Undo log
Undo log 以逻辑方式记录数据库事务的修改操作,它记录了事务执行过程中旧值的备份,以便在事务回滚或并发控制需要时能够恢复数据。
例如:当我们执行一条 insert 语句时,Undo Log 就记录一条相反的 delete 语句。
Undo log 的作用:
- 事务回滚:在事务执行过程中,如果出现错误或需要回滚操作,Undo log 可以恢复事务执行之前的数据状态,实现事务的回滚操作。
- 并发控制:通过 Undo log 的使用,数据库可以实现并发事务的隔离性和一致性,避免数据读取和写入的冲突。
示例:
假设在用户付款过程中,发现付款金额错误,我们需要回滚事务并使用 Undo log 中记录的旧值来恢复正确的付款金额。
-- 在事务中更新付款金额 BEGIN; UPDATE payments SET amount = 100.00 WHERE id = 1; -- 假设发现付款金额错误,需要回滚事务并恢复旧值 ROLLBACK;
通过回滚事务并使用 Undo log 中记录的旧值,我们可以将数据库中的付款金额恢复到事务开始之前的状态,保证数据的一致性。
Undo Log 如何回滚到上一个版本
首先,通过两个隐藏列 trx_id(最近一次提交事务的 ID)和 roll_pointer(上个版本的地址),建立一个版本链。
然后,在事务中读取时生成一个 ReadView(读视图),在 Read Committed 隔离级别下,每次读取都会生成一个读视图,而在 Repeatable Read 隔离级别下,只会在第一次读取时生成一个读视图。
在使用 Undo log 时,需要注意:
- Undo log 的管理和清理:由于 Undo log 会占用存储空间,需要定期清理不再需要的 Undo log,以释放存储空间。
- 配置 Undo log 的大小:根据数据库的并发事务量和数据修改量,合理配置 Undo log 的大小,以确保足够的空间来存储 Undo log 信息。
- 定期备份 Undo log:为了避免数据丢失,定期备份 Undo log 文件,以便在需要恢复数据时使用。
2. Bin log、Redo log 和 Undo log 的区别
三者的区别主要有两点:
2.1 数据记录方式
- Bin log:以二进制格式记录数据库的修改操作。
- Redo log:以固定大小的物理日志文件记录数据库页的物理修改。
- Undo log:以逻辑方式记录事务执行过程中旧值的备份。
2.2 应用场景
- Bin log:用于数据恢复、主从复制、数据审计和数据备份等。
- Redo log:用于保证事务的持久性和故障恢复。
- Undo log:用于事务的回滚和并发控制。
总结
通过本文,我们掌握了 Bin log、Redo log 和 Undo log 的概念、作用及其区别。
Bin log、Redo log 和 Undo log 是 MySQL 中重要的日志机制。
- MySQL InnoDB 引擎使用 Redo log (重做日志)保证事务的持久性。
- 使用 Undo log (回滚日志))来保证事务的原子性。
- MySQL 数据库的数据备份、主备、主主、主从都离不开 Bin log,需要依靠 Bin log 来同步数据,保证数据一致性。
MySQL 实现事务、崩溃恢复、集群的主从复制等,底层都离不开日志,可以说日志是 MySQL 的内核所在。
只有了解 MySQL 日志,才算是彻底搞懂 MySQL。
如果觉得有用,请顺手【点赞】支持下哦,这将是对宝妹儿的最大鼓励,谢谢~
PS.
本文收录于宝妹儿精编的 2023版《MySQL 大厂高频面试题大全》PDF。
搞定这100道题,足以应对MySQL面试。