扫码预约直播,观看精彩内容!

Hadoop HDFS是分布式文件系统(Hadoop Distributed File System)的简称,它具有较高的读写速度,很好的容错性和可伸缩性,为海量的数据提供了分布式存储,其冗余数据存储的方式较好地保证了数据的安全性。然而,操作失误、软件缺陷、硬件故障、勒索病毒、黑客攻击等无时无刻不在威胁着HDFS的数据安全。
传统方式备份Hadoop HDFS过程中,会有以下不足:
例如备份数据的保留有时间上限,备份模式也仅支持完全备份、增量备份,不支持差异备份、永久增量等高级备份模式等。
传统的备份方式可能没有针对Hadoop HDFS的分布式特性进行优化,导致备份大规模数据时可能效率较低。
仅能恢复到源Hadoop集群,无法恢复到其他NAS设备与对象存储等。
基于海量文件的备份挑战,云祺为PB级Hadoop数据备份场景制定了一套完整的方案,凭借多节点并发、高速度传输、加密算法等多种技术的融合,可为用户提供兼顾高性能、高可用与降本增效的备份体验 — —
根据数据体量、IT基础设施等参考因素,结合通配符策略、一致性快照技术、不可变存储、加密传输、副本及归档等,可灵活调整备份策略,即使面对海量的特殊敏感数据和严格的合规性要求,云祺也能为基于Hadoop的科研教育行业场景提供卓越的备份方案 — —
调用REST API对接HDFS,从而可以直接添加Hadoop集群进行备份,有效保证数据数据一致性。
备份文件数据后,支持恢复至异机客户端,以及跨平台恢复至文件系统、NAS设备、对象存储。
提供多线程扫描和多线程传输并发通道,在提高数据备份/恢复效率的同时,兼顾资源消耗配置。
支持文件数据的完全备份、增量备份、差异备份;可按天、周、月设置备份时间策略;支持加密、压缩等高级备份策略。
支持上亿级的海量文件/目录备份和恢复,可通过对单个Hadoop设备配置多个备份/恢复任务,搭配多线程并发提高海量数据备份/恢复的效率。
支持Hadoop目录级快照,有效确保备份与恢复时数据的一致性;同时在数据二次增量备份时,可借助快照提高扫描出增量数据的速度。
请添加好友为您提供支持
jia7jia_7
请拨打电话
为您提供支持
400-9955-698