我所认识中小企业网管和个人似乎都倾向于使用raid, 而多数是采用raid1。在很多人心目中,raid通常会有以下优点:

  • 速度快
  • 冗余
  • 安全

但我这里希望能理顺一下这方面的逻辑。

raid通常需要硬件支持,虽然目前很多主板都已经支持raid,但其功能在实际使用中是否有效尚且存疑。 而很多Linux爱好者常常使用“虚拟raid”,虽然在运行时的效果和实体raid差不多,但如果硬盘出现问题,那解决起来就有点头大了。且并不是所有raid在出错后都能恢复原状。

在“高可用性”的系统中,硬盘是必须支持热插拔的。 而一般中小企业很少需要设备不停机,所以也不会专门购置支持热插拔和自动修复的设备。

采用sata2.0以上的接口的硬盘通常是支持热插拔的。 而raid1,raid10,raid5理论上也支持热插拔。除了这两个条件,还有就是必须使用实体raid卡或主板本身支持raid和自动修复功能。

如果不具备以上条件(通常都不具备), 那么大体上只要硬盘出现问题,特别是保存的资料非常重要、数量非常多的情况下,停机维护是难免发生的事情。

那么,一旦停机发生,raid和单盘之间还有什么本质的区别吗? 答案是:还真没有!

也就是说,在中小企的文件服务器上,raid和单盘之间没有本质的区别,不仅安全性没有保障,还需要多付一些电费和硬件购置费。

关于速度:在中小企业应用中, 很少有机器需要持续每秒吞吐30兆以上数据的情况发生。而sata硬盘通常能够支持到150M以上,千兆网速的峰值也只够125M,所以单盘本身的速度就够用了。

关于冗余:在单台机器上,采用具备声光报警功能的raid系统,很快就能查出问题硬盘,但虚拟raid一般不具备报警功能,需要花时间检查是哪块硬盘出了问题。 这很消耗时间。而且使用同一套供电系统如果两个以上硬盘都出现电流击穿等问题,那就几乎完全无解了。所以,在单机上做冗余毫无意义可言。

总结以上:中小企业的非高可用性服务器上完全没有必要使用raid。因为安全性跟单盘一样,其他两项优点则是鸡肋。

Data-Center-Servers.jpg


那么如何保障数据安全?

其实,不论是Window或Linux还是其它系统,只要存储了重要文件就必须做异地(异机)备份:或者所谓的双机热备。

以下逻辑必须牢记在心:

任何机器都会损坏,只是早晚问题。

有了这个心理准备,就可以算一下数据恢复的成本: 技术服务成本、时间成本、硬件成本

只要数据有有效的备份, 前端的应用服务器不论是遭遇水淹、地震还是暴力破坏,只需要启用一台新机器,装上系统后从备份中恢复数据, 1Tb的数据恢复大体不会超过24小时,对操作人员也不需要非常高的技术要求。

而如果没有备份机,所有数据都存储在同一台机器上,不论采用了哪种raid,其结果一定是需要各种排错,所消耗的时间必然远远不止24小时,特别是虚拟raid,很可能还需要拿到专业的数据恢复公司进行修复。

对于一家需要随时调取资料的企业,停机24小时或许对生产和销售影响较小,但如果停机2天以上、甚至一周,那要付出多大的成本呢?

所以,这笔帐如果这么算, 想必大家都会非常清楚。


所以,我的建议是大家在部署存储方案的时候不仅需要考虑理论上的效果, 还要考虑故障后的后果。 其实一切都可以算成经济账。

而我的建议是: 对于中小企业, 备份服务器才是所有服务器的核心,只要它不出问题, 任何其他服务器出故障或者损毁都可以在极端的时间内恢复而不影响企业运转。

重要提示:备份服务器也是机器,是机器就一定会出故障,只是早晚问题,所以必须做好折旧准备(备份服务器通常5年换新机,而其他服务器则可以用到天荒地老,反正坏了也不要紧),并且做好定期检查。


文件备份计划

备份计划可以做成日计划、周计划、月计划。

日计划是每天备份,但不是全部备份到一套文件系统上。 而是需要做5到7套(根据工作安排而定)。

比如一家公司每周上5天班,周日周六休息,没人会更新数据。 那么备份可以做5套,每周一凌晨自动备份到名为“周一备份”的计划上,每周二凌晨自动备份到名为“周二备份”的几计划上,以此类推。

如此,每天数据的变化都有记录。

举个例子:

假设我在 A 文件夹中存储了 B、C 两个文件夹, 我每天都为A做备份。 有一天,我不小心把B文件夹从A文件夹中删除了(这显然是个错误), 但凌晨的时候,系统自动把A做了备份。 第二天我回想到这个问题,想在备份中恢复B,结果发现备份里也没有B。因为自动备份的时候,系统不会分辨我做得对还是错。

但按照备份5套的做法, 我在周二时的操作失误,可以从周一的备份文件中恢复。 这样一来资料就不容易丢了。

Tags: raid

我有个想法