English

为什么使用热备盘是一个糟糕的主意?

每当我们提出这个问题时,人们往往感到惊讶。

对热备盘的普遍看法告诉我们,使用热备盘是一个非常不错的主意,比如:可最小化阵列降级(Degraded)状态的持续时间,等等。

那么,为什么使用热备盘是一个糟糕的主意呢?

尽管热备盘有助于最大限度地减少阵列降级状态的持续时间,但我们创建磁盘阵列的目的在于当某个驱动出现故障时,磁盘阵列能够继续运作同时没有数据丢失。那么,任何增大数据丢失风险的方法都是糟糕的。

根据多年的经验,我们了解到:在磁盘阵列重建期间,附加驱动器发生故障的概率是相当高的——重建将对现有驱动器造成很大的压力。因此,一旦驱动器故障并导致阵列出现降级状态时,我们建议执行如下操作:

  1. 进行一次数据全备份。

  2. 验证备份数据的一致性,并验证数据恢复机制是否工作。

  3. 识别问题的根源,即找到错误的硬盘。如果可能的话,关闭服务器,并确保硬盘序列号与磁盘控制器记录的序列号相匹配。

  4. 将已损坏的硬盘替换为一个未经使用的新硬盘。如果更换的硬盘驱动已经被另一个磁盘阵列使用,确保该硬盘的元数据均已被原来的磁盘阵列控制器删除。

  5. 重建磁盘阵列。

采用上述方法,重建操作在第五步!而使用热备盘,你的磁盘阵列将跳过前两个至关重要的步骤,而自动执行第三步、第四步、第五步。如此一来,磁盘阵列并未进行关键的数据安全确认操作,便已完成重建。

依照墨菲定律,没人会冒险在驱动器故障发生后立即进行重建——但热备盘正是这样做的。如果你能停下来考虑数据的完整性,你也会得出相同的结论:使用热备盘是一个糟糕的主意。

文章来源:Why a HOT-SPARE Hard Disk is a bad idea?

联系我们