与可靠性相关的概念有以下几个 :
1 、可靠性
可靠性只指产品在规定条件下和规定时间区间内完成功能的能力 。这是国家标准中给出的定义 。标准的作用是用来衡量一个产品的好坏 。那么怎么如何评价一个产品可靠性的好坏呢?这就需要对这个定义进行度量 。
一般来说“规定条件下”是恒定不变且长期保持的 ,是不具备度量条件的 。首先一个产品的“功能”基本完整才可能被视为可用的产品 ,也不具备度量条件 。因此可度量的就只剩下“时间”和“能力“ 。而能力是个很宽泛的概念 ,比较通行的度量的能力的办法就是”概率“ 。因此这个定义可以近似等效为 :“在固定条件下和规定时间区间内保持功能完好的概率”或者”在固定条件下所有产品平均保持功能完好所持续的时间 (失效概率为50%)“ 。
这就引出了衡量可靠性的两个参数 :失效概率“和”平均无故障时间“ 。且这两个参数是互为相反数 。值得注意的是 ,如果“规定条件”发生变化 ,是允许可靠性下降的 ,但下降的趋势也是可靠性设计的需要关注指标 。
本文主要讲可靠性 ,这些概念后面还会被多次用到 。
2 、可用性
evo视讯(中国)经常会听到客户抱怨你的设备不稳定 、不好用 、不方便等等 。用户最终会抱怨是设备不可靠 ,不稳定 。其实准确的说这些都是可用性问题 。
可用性的定义是 :在要求的外部资源得到保证的前提下 ,产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力 。它是产品可靠性 、维修性和维修保障性的综合反映 。因此可用性是包含了可靠性的 。
可用性与可靠性的关联在于都必须考虑设备的应用环境 。但是可靠性更关注的是在这个环境中能用多久(用概率表现的时间) ,而可用性则反应的是能不能用?能不能用好?以及能不能达到用户的期望?可用性需要考虑客户在合理的使用条件下能完全正常的工作 。比如笔记本电脑 ,显然是可能被用户带出国 ,那么笔记本电脑在不同国家的电网的额定电压条件下能否正常工作就是一个重要的可用性指标;台式电脑基本就不需要考虑这种问题 。埋在地下的电缆 ,显然有必要考虑被老鼠啃食的问题 。这些都是可用性问题 。而可靠性一般只用考虑额定条件下的使用时间 ,兼顾非正常条件下的降效指标即可 。
比如说某个设备的操作员突然由一个男士变成一个女士 ,设备由于没有考虑到操作员的身高和力量的差异 ,导致女士操作的频次比男士低很多 ,而引起系统的运行效率下降 ,evo视讯(中国)可以据此就认为设备的可用性不好 。但是由于女士操作的频次下降却很可能使设备的可靠性提高了 。
再举个例子 ,某个产品标称值为额定电压12 ,输入电压范围为10V~15V ,平均无故障时间(MTBF)为3000小时 。那么它隐含的意义是期望在12V条件下工作3000小时 ,其失效概率低于50%(估算值) 。并没有保证客户在输入15V条件下也能持续工作3000小时 。当然这个参数在实际中也不会差距太大(主要与产品寿命分布有关) 。但如果产品提供者和使用者没有就这个问题沟通清楚的话 ,会给双方都带来很大的困扰 。这就不再是可靠性问题而变成一个可用性的问题了 :“用户实际需要的供电模式是什么?”
3 、安全性
很显然 ,在相同条件下更可靠的设备也更安全 。但是安全性与可靠性依然是两个不同的概念 ,有时候甚至是矛盾的 。举例来说 :核电站的要求的失效概率达到10-8~10-9以上(SIL5级) 。这样的标准要求如果换算成MTBF ,没有任何一个电子设备有可能达到这样的指标 。但通过多个电子设备的并联 、冗余 、监视 、保护等措施达到这一标准却是可能的 。而新增加的这些保护 、冗余等设备事实上会降低整个核电站的平均无故障时间 。
为了解决安全性与可靠性的矛盾 ,许多应用场景会定义不同等级条件下的可靠性指标 。比如地铁车辆的规定 :发生A类故障(人身安全事故)的MTBF大于1百万小时 、发生B类故障(停止运营)的MTBF大于10万小时;发生C类故障(更换维修)的MTBF大于1万小时 。
4 、可维护性
从“1.1可靠性指标的定义”节内容可以看到 ,通过合理设计“可维修的部件”可以有效提高系统寿命(注意与MTBF的区别) 。但是对于用户而言任何更换维护都意味着成本 ,即使是免费更换也要占用用户的时间成本 。维护成本是设备全生命周期成本(LCC)的重要组成部分 。因此在设计时应尽可能少的设计“可维修的部件” ,迫不得已必须设计的也要尽可能的方便维护 ,使维护的时间和花费降低到最小 。