硬盘数据保护技术 计算机用户们对数据存储与数据恢复可靠性的期望值很高。许多用户甚至从不考虑硬盘故障可能导致数据丢失的情况。尽管技术的日益进步使数据丢失现象已不常见,但也不能排除其可能性。 S.M.A.R.T技术其实不是一项新数据保护技术,只是由于它得到了广泛的应用,现在几乎所有的计算机系统中都能支持S.M.A.R.T技术,因此在这里笔者再简单多说几句。S.M.A.R.T.技术就象拼七巧板,需要把许多块拼图正确拼装在一起,最终形成一种图案。如前所述,推定故障就是其中的一块拼图。另一块就是确定属性的方法。属性是进行可靠性预测的参数,由制造商为各种硬盘量身设定。为了确定属性,硬盘的设计工程师们对返修硬盘进行了检查,研究设计要点,为他们所看到的各种故障确立相应的诊断属性。来自应用现场的信息可用于预测可靠性问题的研究,并最终纳入到新的可靠性结构之中。 尽管不同的硬盘属性各异,但是它们还是有以下一些共同之处: <> 磁头飞行高度 <> 数据吞吐性能 <> 起旋时间 <> 重新分配的扇区计数 <> 寻道错误率 <> 寻道时间特性 <> 试旋重计数(spin try recount) <> 硬盘校准重试计数 (drive calibration retry count) 上面所列的属性是几种能反映可靠性的典型指标。从根本上讲,硬盘的设计决定了制造商将选定哪些属性。因此可以认为,属性因制造商而异,并取决于硬盘的设计。 由于ATA硬盘和SCSI硬盘对数据特性具有不同的要求,因此当SFF-8035(1995年5月12日,Compaq公司向Small Form Factor委员会提交了专为ATA/IDE 开发的IntelliSafe,也称为SFF-8035)进入公共领域时,用于ATA/IDE环境的S.M.A.R.T.开始出现。SCSI硬盘采用了一个不同的行业标准,如ANSI-SCSI Informational Exception Control (IEC)中定义的X3T10/94-190。适用ATA/IDE和SCSI环境的S.M.A.R.T.系统技术的属性和门限值相似,但在信息的报告上却不相同。 在ATA/IDE环境下,由主机上的软件对S.M.A.R.T“报告状态”命令生成的、来自硬盘的告警信号进行解读。主机定期对硬盘进行查询,以检查这一命令的状态,如果显示马上要发生故障,就将告警信号送至最终用户或系统管理员。系统管理员就安排关机时间,以备份数据和更换硬盘。这一结构还可以进一步改进,即能够报告除硬盘以外的其它信息,如温度告警、CD-ROM、磁带,或其它I/O报告等。主系统除对来自硬盘的“报告状态”命令进行评估外,还可对属性和告警报告进行评估。 一般来说,具有可靠性预测功能的SCSI 硬盘只报告状况完好或出现故障。在SCSI 环境中,由硬盘进行故障判断,然后由主机通知用户采取措施。在SCSI 标准中有一个检测位,当硬盘确定可靠性出现问题时,检测位就打上标记。系统便通知最终用户或系统管理员。 硬盘数据保护技术之MaxSafe增强版 除了大家耳熟能详的S.M.A.R.T.技术外,各家硬盘厂商现在均竞相推出了各自的硬盘数据保护技术,例如原IBM硬盘公司就有DFT技术,原昆腾硬盘公司有DPS(数据保护系统),迈拓公司有MaxSafe技术,西部数据公司有数据卫士(Data Lifeguard)技术,希捷公司有3DS系统。笔者这里再对Maxtor的MaxSafe技术和希捷的3DS系统进行简要介绍。 MaxSafe(增强版) 硬盘数据保护技术与数据恢复技术 高性能高容量硬盘很重要,但可靠性也是一个不能忽视的因素,MaxSafe是Maxtor硬盘专有的数据安全系统。从硬盘原理我们可以知道,硬盘内部是一个非常非常清洁的空间,比医院的隔离病房还要干净得多,一个极小的微粒也会造成数据错误。尽管厂商们不断追求更为干净的制造环境,但是无论采用如何高级的过滤措施,仍然不能完全防止灰尘的入侵,MaxSafe系统的设计本意就是为了在数据丢失之前,发现和修正这些错误。 Maxtor的数据完整性判断很简单:识别和决定可能发生问题的潜在点,MaxSafe先检查数据瞬时写入的正确与否,再监测长时间的数据存储过程,其中动用到三个技术:后台磁盘表面扫描、高级ECC、高速写入侦察。 后台磁盘表面扫描与硬盘数据保护 ECC提供了一串数据位,使用复杂的译码算法计算,把自身附加在每一个存储在磁盘的数据上。当你存取这些资料时,附加的额外数据位会解码和校验数据,与原始记录相比较。如果编码/解码算法侦察有差异,将动用ECC位来修复不正确的数据。MaxSafe使用硬盘的idle(空闲)周期从磁盘读取数据,再使用硬盘电路版上的ECC来验证,最后把修复的数据存储在磁盘的另一点上,以上操作独立于主机系统,不会受到我们的干涉,充分利用了硬盘的每 一段工作时间。 高级ECC与硬盘数据保护 从DiamondMax Plus 5120开始,Maxtor的所有产品已经包含了错误侦测和修正能力,与以前的产品相比,等于有了双重的ECC,每512byte个用户数据块,就有430 bits的ECC校验位。旧式的ECC可能会出现错误的修正,但高级ECC拥有两次校验操作,使错误发生率降到了1/10^20 bits。以250KB文件读取为例,1秒读1个文件,1天读取24小时,平均犯错时间为150万年。 <> 高速写入侦察 以今天的技术来计算,每英寸盘片大约可以存储1百万个文件,在写入资料时,如何磁头飞得太高,数据将不能被准确地记录下来。高速写入侦察用于检查每次数据写入的高度,确保磁头维持在安全写入区域内。 硬盘数据保护技术之希捷3D防护系统(增强版) 3D防护系统是希捷公司所独有的硬盘保护技术,它包括硬盘防护、数据防护和诊断防护。而这三方面的防护技术可确保用户得到的是高质量、高稳定性的硬盘。3D Defense System是捆绑在希捷硬盘特性中的一种保护手段,这可确保硬盘在震动及其它冒险性动作中对用户数据的损坏。同时它还带有诊断工具以供用户对硬盘的错误进行标识或解决。这个3D指得是Drive Defense(硬盘防护)、Data Defense(数据防护)及Diagnostic Defense(论断防护) Drive Defense(硬盘防护与数据恢复) 磁盘保护包括如下几大方面: G-Force 保护:可帮助希捷硬盘承受业内最高的非工作状态下的防震水平,即在2ms内震动力即使达到350G,也不会使硬盘损坏。 SeaShield 保护:提供ESD及安全处理,特别是对PCBA(Printed Circuit Board Assembly)板。 SeaShell保护:这是一种可以替换原有ESD(Elestro-Static Discharge)的硬盘工具包,这将为硬盘提供更多的保护、更易使用。 Data Defense(数据防护与数据恢复) 希捷先进的Multidrive系统(SAMS)--SAMS通过减小硬盘的旋转振动来减小对硬盘损坏,主要包括: ECC(Error Correction Code,错误检正代码)---为高性能硬盘提供on-the-fly检正,还有就是对数据恢复提供最大限度firmware(固件)检正,因此数据可以正确完整地进行读及恢复。 Safe Saring---当硬盘断电及重新来电后,此Safe Saring可确保硬盘磁头回到同样的扇区,以保证数据不丢失。 End-to-End Path Protection-确保数据在主机与磁盘之间传输的完整性。 Diagnostic Defense(诊断保护-数据恢复) SeaTools--诊断工具软件,可以帮助用户诊断系统是否存在问题,以及诊断错误是否由其它硬件及软件产生 SeaTools可以大大地避免硬盘的返修,以节约用户开支及保护用户宝贵数据。它可以在ATA及SCSI产品中工作,包括全部的旧希捷硬盘。 增强的S.M.A.R.T(Self-Monitoring, Analysis and Reporting Technology自诊断,分析及报告技术):可在硬盘错误与问题发生前向用户发出警告。 Web-Based Tools(基于Web的工具):可以允许用户标识及解决一些非硬盘相关错误,如病毒等,也可以检正文件系统,解决硬件冲突以避免不必要的硬盘返修。
DLD(Drive Logging Diagnostics)--捕获不可恢复性数据错误,实质上就是交互性的诊断工作。
硬盘数据保护系统,是每一款硬盘所不可或缺,失去数据保护系统的硬盘是没有使用价值的。而为了更方便最终用户使用,许多硬盘厂商都将各种保护系统的微代码写入硬盘firmware 中,用户可以通过更新firmware 得到最新的数据保护技术和震动保护系统等。 另外,硬盘厂商们还为方便用户使用,都拥有额外诊断程序,它是用户诊断硬盘健康状况的接口,这些程序很多,例如IBM公司推出的DFT(Disk Fitness Test)、Maxtor公司推出的PowerMax、西部数据公司推出的Data Lifeguard(数据卫士工具包)和希捷公司推出的SeaTools等硬盘数据保护工具。
|