到2018年,70%以上的新内部应用已经是基于开源数据库管理系统(Open Source DBMS)开发的。

事实上,现在每10个数据库中有6个就是开源数据库,其重要性与日俱增。今天的企业是一个复杂的、异构的环境,IT正努力应对不断加速的数据增长和下一代工作负载。大多数关系型数据库(RDBMS)是为诸如复杂的ERP应用而设计的,随着组织开始转向基于Web的应用,管理和保护这些新兴工作负载所需的技术就变得愈发重要。

生产环境迈向现代化了,问题是数据保护方法和工具集也同步更新,跟上了时代节奏吗?

一种经常能从使用大数据或开源数据库客户那里听到的论调是:“我不需要备份数据库,因为我有复制功能。”然而,这并非万全之策,无法理想地保护组织的数据。

复制、快照,甚至内置备份/恢复工具,不少大数据和开源数据库系统都能提供某种形式的数据保护机制,但根本上,它们缺少实现和维护企业级数据保护所需的时间点备份和恢复功能。

为什么需要备份大数据和开源数据库环境?下面几点原因值得深思:

创建备份的主要原因是为了防止由于逻辑或人为错误导致的意外或恶意数据丢失。带有非现场拷贝的备份还应对发生完全灾害的情形。

复制虽可提供实时/近实时的保护,但并不能防止可能导致数据丢失的逻辑或人为错误发生。

虽然有时可以从原始数据源重建数据,完成手动恢复,但大多数情况下,数据会从源头上丢失或不可用,或者重建过程是时间所不允许的。

很多大数据和开源数据库系统都被用于执行关键任务应用,因此组织需要审慎地考虑应用程序停机可能带来的影响,包括法规遵从、经济损失等。

最新的NetBackup 8.1.2版本中,用户可以通过Veritas独特的并行流处理(Parallel Streaming)技术来保护大数据工作负载,如Hadoop/Hbase。该技术支持时间点备份,并以较低的成本消除了对额外复制集群的需求。用户还可通过使用NetBackup简洁的插件技术,来保护开源数据库,如Postgre/MariaDB/MySQL/SQLite等。

当今的数据保护实践中,我们常见的传统技术大概是这样的:

客户端安装在NameNode服务器上,并消耗资源

所有数据,包括冗余数据,都是从可能多达数百个的数据节点通过NameNode备份的,从而造成性能瓶颈

客户端通常在较长的供应商发布周期后可用,这会限制受支持的工作负载数量,并带来延迟部署的问题

从NetBackup 8.1开始,Veritas引入现代化的并行流处理架构Parallel Streaming,通过提供按需即插的便捷方法,保护最严苛的横向扩展、多节点工作负载。

无代理客户端插件安装在动态扩展的备份主机上:

对NameNode资源没有影响

可以部署N个备份主机以优化流式处理性能

新工作负载插件可以快速开发,并由Veritas或第三方提供

工作负载插件独立于NetBackup版本,可按需提供

自动发现优化备份性能和存储利用率:

标识要备份的文件位于哪些数据节点或服务器上

标识已备份的数据,减少冗余数据,降低备份时间

面向开源数据库工作负载环境的数据保护插件一览:

-130802189-0/v127651622-130802189

-130301557-0/v130037261-130301557

-129955710-0/v129277265-129955710

行业分析市场一线的洞察显示,到2019年,DBMS市场总开支的10%将来自开源系统,整体价值高达350亿美元。事实是,无论用户的工作负载环境如何变化,Veritas都能提供高效、无差别的保护。

相关阅读