PB 级数据仓库 | GaussDB(DWS) 超大规模数据保护最佳实践
发布人:scutech 发布日期:2025-03-25 12:06:15 点击数:224
随着数字化转型的加速,各行业业务场景日趋丰富,海量数据从交易系统、物联网设备、用户行为等渠道持续涌入,数据规模呈现爆炸式增长,数据仓库应运而生。华为云数据仓库GaussDB(DWS)凭借高并发查询能力、行列混合存储、向量化引擎等技术,可实现 PB 级数据秒级分析,目前已广泛服务于金融、电信、能源等行业,成为国产首选的数据仓库解决方案。
而超大规模 GaussDB(DWS)的数据保护方案,往往面临备份数据巨大、备份窗口过长、恢复准确度低、性能调优不便等困难。鼎甲 DBackup 作为华为长期的合作伙伴,与华为云深度融合开发,推出 XBSA 流式 GaussDB(DWS)数据仓库保护方案,打破上述备份难题,并于两年前顺利上线国内头部银行 1.6PB 超大规模 GaussDB(DWS),且稳定运行至今。
1. DBackup × GaussDB(DWS) ,保护方案四大核心优势
一、精细化备份恢复
支持库、表、schema 级的灵活备份恢复,精准定位目标数据,恢复效率提升 80%。
二、云原生性能调优
深度融合的云原生备份工具 Roach,专为多种业务场景设计,提供了 10 项关键的性能调优参数,以确保卓越的性能表现。
三、分布式重复数据删除
采用分布式重删架构,为多节点模式下的 GaussDB(DWS) 集群提供数据保护,并支持负载均衡调度、故障容错机制和在线扩展能力。项目实测数据显示,备份重删比平均可达 86%。
四、官方认证解决方案
国内头部银行在其核心业务中采用 GaussDB(DWS),系统架构超 150 个数据节点,日需高效处理数十亿级别的交易记录,累积高达 1.6PB 的数据量。面对如此超大规模集群,客户期望数据保护能实现以下优化目标:
● 快速备份恢复——2 小时备份窗口,TB 级数据在分钟级恢复;
● 精准数据保护——需支持细粒度恢复,如:单表恢复;
● 高效存储管理——重删比高,大幅度节省备份数据的存储成本。
实施方案
鼎甲 DBackup 结合客户实际组网架构与软硬件要求,打造如下部署方案:
国内头部银行在其核心业务中采用 GaussDB(DWS),系统架构超 150 个数据节点,日需高效处理数十亿级别的交易记录,累积高达 1.6PB 的数据量。面对如此超大规模集群,客户期望数据保护能实现以下优化目标:
1、非侵入式部署:备份组网无需在 GaussDB(DWS) 节点上安装代理软件,仅需要在独立的服务器或存储服务器上配置备份主机,用于连接 GaussDB(DWS) 和备份系统。现场实施中,仅部署 12 台备份主机,即满足 150+ GaussDB(DWS) 集群节点的并行备份要求。
2、分布式重删: 备份系统采用分布式重删架构,通过构建 48 节点的重删存储池和极致的重删比,有效承载 1.6PB 业务数据经备份生成的多份历史副本。
3、TCO 低:项目采用万兆网卡和低成本的机械硬盘,而非 25/40G 高性能网络和 SSD 硬盘,通过高效的备份软件,实现备份数据高速传输与持久化存储。
实现效果
● 高吞吐备份:生产环境增量备份平均速度可达 9.62 GiB/s
● 分钟级恢复:1 分钟内精准恢复 200GB 表,满足金融行业严苛的 RPO 要求
● 极致重删压缩比:完全备份重删率最高可达 99%
● 上线至今 0 故障,稳定运行超 18 个月!
面对蓬勃发展的大数据浪潮,数据保护已成为永恒的话题。鼎甲推出的华为云数据仓库 GaussDB(DWS) 保护方案,在功能细化与性能方面表现卓越,并历经超大规模场景下的打磨,成为业界数仓保护的新标杆!
更多 DBackup 支持 GaussDB(DWS) 功能细节,可阅读: