浅谈服务器内存保护技术
服务器内存在外观上和普通内存没有什么实质的区别,但服务器内存相对于普通内存需要更高的稳定性和纠错能力,所以服务器内存引入了一些特有的技术,如ECC、Chipkill、Register和Fully-Buffered等。此外,不同厂商为提高内存的可用性,也提出了不同的内存保护技术,如IBM的Memory ProteXion、惠普的在线备份内存技术等。
下面我们来了解一下服务器上所应用的内存技术:
高级ECC
目前服务器上普遍应用了高级ECC技术,对于ECC技术大家可能并不陌生,ECC的英文全称是Error Checking and Correcting,即错误检查和纠正。ECC是一种内存的纠错技术,与奇偶校验技术不同,ECC可以发现和纠正数据写入内存和从内存读出时的错误,ECC技术可以检测单DRAM芯片上发生的任意两个随机错误,最高可以检查到4比特的错误,但是ECC只能修正1比特的错误。
高级ECC技术是ECC技术的增强版,可以发现和纠正单一内存芯片上的多比特错误,也可以纠正内存条上单芯片的失效,进一步提高了内存可用性,为服务器提供了更高级别的内存故障保护。
在一个4比特的高级ECC内存中,每个芯片可以向数据字提供4比特数据,这4比特数据被分给4个ECC设备,每个设备1比特,所以4比特的高级ECC内存可以同时处理4个独立的错误。
在线内存备份技术
在线备份内存模式是比高级ECC更高级别的内存保护技术,在该模式下,系统将内存分为3组,分别为系统主内存,扩展内存,备用内存(容量大于或等于主内存),当检测到主内存发生错误时,系统自动将主内存存储的数据复制到备用内存,并且停止使用主内存,而不影响系统和程序的正常运行,并通过管理软件向系统管理员发出警报,直到出错内存更换。
镜像内存技术
内存镜像相当于磁盘上应用的RAID-1, 是将两组或四组内存互相做镜像,当一组内存出错,另外一组马上接替工作。使用镜像技术时,实际使用容量为安装内存容量的一半,并且需要在内存专用工具里开启镜像功能。
镜像内存和主内存互成对角线分布,如果其中一个通道出现故障不能继续工作,另一个通道仍然具有故障通道的内存数据,有效防止了由于内存通道故障导致的数据丢失,极大提升了服务器可靠性。镜像内存的容量要大于等于主内存容量,当系统工作时,镜像内存不会被系统识别。
热插拔RAID内存技术
热插拔RAID内存(Hp Hot Plug Raid Memory)在概念上和RAID 4磁盘存储技术是相似的,在系统架构上更像一个硬盘,所以采用热插拔的RAID内存保护模式的系统可以达到像RAID硬盘一样随意替换内存的效果。
采用热插拔RAID内存方式的服务器使用5个内存控制器来控制5个内存盒(memory cartridges)。每个盒可以安装最多8个工业标准DIMM ,当内存控制器要向内存中写数据的时候,它们会把数据分成4块写入4个内存盒,并计算奇偶信息存放在第5个内存盒。利用4个内存盒中的数据和第5个内存盒中奇偶信息,数据可以完全恢复,即使是任何DIMM工作故障,或任何一个内存盒被拆掉了,也可以做到不丢失数据。
本站广告:业务范围:湖南主机托管、湖南服务器托管、长沙主机托管、长沙服务器托管、湖南主机租用、湖南服务器租用,实力雄厚、资源丰富!