Doris 元数据恢复步骤

恢复后检查 FE 的 image/VERSION 中 clusterId 是否与 BE 一致，不一致需手动修改（避免 BE 注册失败）。生产环境部署 ‌3 FE 节点‌（1 Follower + 2 Followers/Observers）提升高可用性。主节点按‌单节点恢复流程‌操作（启用 metadata_failure_recovery 并重启）。元数据版本‌不可向后兼容‌，高版本恢复后禁止回

jiedaodezhuti

852人浏览 · 2025-06-24 13:39:51

jiedaodezhuti · 2025-06-24 13:39:51 发布

以下是基于实际运维场景的 Doris 元数据恢复操作指南，综合备份恢复与紧急处理方案：

‌一、通过备份快照恢复元数据‌
1‌.1 查询可用备份

SHOW SNAPSHOT ON example_repo;  -- 查看仓库 example_repo 中的备份快照

输出示例‌：

+-----------------+---------------------+--------+
| Snapshot        | Timestamp           | Status |
+-----------------+---------------------+--------+
| exampledb_backup| 2022-04-08-15-52-29| OK     |
+-----------------+---------------------+--------+

‌1.2 执行恢复操作‌

‌ 恢复整个数据库‌：

RESTORE SNAPSHOT example_repo.`exampledb_backup` 
FROM `example_repo`
PROPERTIES ("backup_timestamp" = "2022-04-08-15-52-29");  -- 需替换实际时间戳

恢复单张表‌：

RESTORE SNAPSHOT example_repo.`exampledb_backup`
FROM `example_repo`
ON TABLE `backup_tbl`;  -- 指定表名

关键验证‌：恢复后执行 SHOW RESTORE 检查任务状态，确认 State 为 FINISHED。

二、紧急恢复（元数据损坏且无备份）

‌2.1 单 FE 节点故障恢复‌

故障节点 fe.conf 中启用元数据恢复模式：

metadata_failure_recovery = true  -- 强制启动修复

重启该 FE 节点，进入安全模式加载元数据.

成功后立即关闭恢复模式‌：

# 注释或改为 false
# metadata_failure_recovery = false

再次重启 FE，验证集群状态：

SHOW FRONTENDS;  -- 检查角色及 Alive 状态

2.2 多 FE 集群主节点损坏

停止所有 Observer 节点：

sh bin/stop_fe.sh  -- 在所有 Observer 节点执行

主节点按‌单节点恢复流程‌操作（启用 metadata_failure_recovery 并重启）。

修复后重新加入 Observer：

ALTER SYSTEM DROP OBSERVER "OBSERVER_IP:9010";  -- 先移除异常节点

sh bin/start_fe.sh --helper MASTER_FE_IP:9010 --daemon  -- 重新加入集群

三、关键注意事项‌
‌3.1 元数据兼容性

元数据版本‌不可向后兼容‌，高版本恢复后禁止回滚旧版本。

升级前需严格测试元数据兼容性（参考 FeMetaVersion.java 变更）。

3.2 ‌存储目录结构

元数据目录标准结构（fe.conf 中 meta_dir 配置）:

/doris-meta/
├── bdb/           # BDBJE 日志（异常增长需检查 image 生成）
└── image/         # 元数据镜像文件（含 ROLE、VERSION）

禁止直接删除 image 文件‌，仅故障时可删除 ROLE 和 VERSION 文件触发重建。

3.3 集群 ID 一致性

恢复后检查 FE 的 image/VERSION 中 clusterId 是否与 BE 一致，不一致需手动修改（避免 BE 注册失败）。

3.4 前置依赖

确保所有节点时间同步（NTP 服务），偏差超过 5s 可能引发元数据同步失败。

灾备建议‌：

定期备份元数据：BACKUP SNAPSHOT + 对象存储（如 S3）。
生产环境部署 ‌3 FE 节点‌（1 Follower + 2 Followers/Observers）提升高可用性。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

iwr -useb https://openclaw.ai/install.ps1 | iex 这里的iwr怎么安装？

摘要：iwr是PowerShell中Invoke-WebRequest的别名，用于发起HTTP/HTTPS请求。命令iwr -useb https://openclaw.ai/install.ps1|iex表示下载并执行远程脚本。在Windows系统中，iwr是PowerShell 3.0+的内置命令；Linux/macOS需安装PowerShell Core才能使用。执行前需验证来源可信性，并注

2048 AI社区

C++进阶9：异常和智能指针

2048 AI社区

精细化拓客背景下，B端号码核验的困局与技术破局路径氪迹科技法人、股东、号码核验、筛选系统

B端拓客正面临号码核验的精准度与成本双重困境。传统核验模式存在精准度低（不足85%）、数据滞后、成本高企等问题，导致大量无效线索消耗人力财力。新兴技术方案通过AI算法和实时算力，将精准度提升至98%，核验成本降至行业1/3，并解决数据时效性问题。这种"低价高质"模式适配电销、金融等多元场景，支持API对接和批量处理，帮助团队实现降本增效。技术驱动的核验服务正成为行业趋势，推动B