科普 | 流式备份,又快又稳又便捷的数据备份模式!
发布人:Marketing 发布日期:2025-04-22 11:03:14 点击数:22
用户在数据备份技术上的核心诉求从未改变:既要速度快,又要运行稳,管理更简单。要同时体验到这三方面的优势,与备份方式密切相关——你使用的是中转备份,还是流式备份?本文我们将用通俗的方式带你深入了解这两种备份的本质区别。
1 技术原理对比,路径决定效率
一、中转备份
流程:
① 启用预置在业务服务器的备份脚本,从源端读取备份数据。
② 生成临时备份文件,写入业务服务器本地的中转存储空间/中转硬盘。
③ 从中转存储空间中读出临时备份文件。
④ 传输至远端备份目标。
解读:
• 备份数据在中转节点来回传输,消耗大量的磁盘 IO,挤占业务 IO,成为系统的性能瓶颈。
• 临时备份文件占用大量存储空间,容易导致本地硬盘空间不足,引发业务故障及备份失败。
• 需要根据应用类型编写对应的备份脚本,难以迭代升级,人工运维工作量大,出错概率高。
• 有些实现方式需要“挂盘”,不仅传输效率低、暴露更多系统端口、且不支持源端去重压缩。
• 对于数据量大的应用,不仅备份速度慢,而且中转存储空间大,难以通过这种模式来备份。
二、流式备份
流程:
① 实时获取已生成的备份数据,如:数据文件 / binlog / redo log 等。
② 将采集到的备份数据,通过网络发送到备份系统,写入到目标存储。
在此备份过程中,支持断点续传、多线程上传、源端重删、压缩、加密等,确保备份数据的一致性和高性能传输。
解读:
• 备份数据全程在应用服务器内存中处理,无需本地中转落盘。
• 策略配置在管理端预置,下发到备份 Agent 中按时自动执行。
• 无需定制任何备份脚本,有利于应用系统和备份系统的版本迭代更新。
• 支持多种类型的数据传输安全机制,确保数据的安全性和可靠性。
• 备份数据的处理效率更高,支持丰富的备份高级特性,运维管理简单。
| 类比说明,以仓库中的货物出站为例:
中转备份如同一个老式仓库,需要开辟临时堆场,用推车将一件件货物从仓库中取出,临时暂存到堆场中,再用推车装上发货车辆,发往目的地。工作节点多、易出错、占用空间大、运营成本高。
流式备份则是一个高科技仓库,使用自动化传送带,货物从仓库直达发货车辆,货物直接装车,发往目的地。不额外占用空间,工作节点少、不等待、效率高、链路短、运营成本低。
2 实现流式备份,需要跨越技术鸿沟
表面上看,“边传边备份”很理想,但要真正做到“流式”,其实背后挑战重重:
总结来说:开发一套高效的流式备份功能,不仅需要强大的研发实力支撑,还需要长期的技术投入,在已有流式框架的基础上,适配更多的应用类型,才能保持产品的市场竞争力。
3 鼎甲 DBackup,流式备份的践行者
对于流式备份的实现方式,也存在不同的认知和解读。如果在实际使用中发现:仍需要基于脚本、手动配置存储路径、各种繁琐的调参、本地空间经常爆满等。大概率是通过封装第三方类似 Rsync 工具来实现的伪流式方案。
伪流式备份方案,基于低效的校验算法、低效的压缩算法、且难以实现多线程/多通道备份,性能整体表现低下。采用这种实现模式,无非是不想精心研究和钻研技术,而是想快速适配应用。看似提供了应用的备份能力,实则是半成品,后续维护的成本会大大增加。
作为国产数据保护的头部厂商,鼎甲早已落地成熟的流式备份方案,并广泛应用于政企、金融、电信等关键行业。我们不是“脚本 + 缓存 + 中转”的伪流式,而是真正实现了:
鼎甲核心技术实力包括:
• XBSA:连接应用与备份存储,提升新应用的适配效率。
• EOBS:提供标准化的对象存储接口,无缝对接新兴应用。
• EPFS:基于文件系统 Native 接口,多线程高速传输。
• 自研框架:保障全链路的效率和可靠性,保证版本迭代和版本升级。
• 流式重删:流式备份过程中即实现重删,减少备份链路带宽占比。我们在文档和 PPT 中写明的每一项功能,都是经过真实场景验证的——真正做到“所见即所得”。