可靠性、利用率和维修率
reliability,availability and serriceability (RAS) RAS技术是研究如何提高电子计算机可靠性、利用率和维修率的一门综合技术。国内外的许多计算机系统都采用了这门技术。RAS已成为评价一台计算机性能好坏的重要标志之一。其基本目标是:
(1)尽量减少硬件故障的发生,使其对系统的影响降低到最小限度;
(2)当发生硬件故障或逻辑错误时,能够及时发现并加以处理,不使其蔓延下去而造成更大损失;
(3)当硬件故障或逻辑错误引起系统故障时,能在尽量短的时间内使系统恢复工作。
RAS技术主要包括以下几方面内容。
(1)采用可靠性高的元件、器件及设备。对所有元器件进行筛选和老化处理;并严格按工艺要求进行组装、焊接,彻底消灭虚焊和接触不良的现象。
(2)设置周密合理的错误检查系统,以便及时发现错误。为此,必须在系统各关键部位设置必要的监视线路,以便及时捕捉到任何错误信息,并使其被消灭在萌芽状态。
(3)建立故障诊断系统,以便能迅速地确定故障的位置,尽快地排除故障,以提高系统的运转率。
可靠性R(t)是建立在元件可靠和系统设计可靠性基础上的,它与产品的性能、使用环境和使用时间有关。其不可靠概率是产品故障率λ和时间t的函数。
单台设备的可靠性 (12—10)
故障率λ=故障次数/故障间隔时间(1/小时)
可靠度R,即在操作时间内不发生故障的概率,是可靠性的尺度。
由式(12—10)可见,可靠度随故障率和故障时间的增加以指数规律下降。组成系统时,系统可靠度为:
(12—11)
式(12—11)中:m=MTTSF,是系统平均无故障间隔时间。
利用率表示系统、设备在某特定的瞬间维持正常功能的概率。它与故障率λ(t)、故障密度函数f(t)和平均维修时间MTTR(mean time to repair)有关。通常在偶尔发生故障期间所产生的故障率按“泊松”分布来考虑。对单一系统来说:
(12—12)
(12—13)
(12—14)
平均故障间隔时间MTBF(mean time between failure)
(12—15)
稳态时间利用率
A=MTTSF/(MTTSF+MTTR) (12—16)
维修率弘表示在稳态运行中需要修理一次的时间。
(12——17)
利用率、故障率和维修率的关系为:
(12—18)
如果MTTSF~>MTTR,或者μ》λ,则系统有效运行时间越长,利用率越接近100%。
——摘自《安全工程大辞典》(化学工业出版社,1995年11月出版)