基于UPS电源供电系统可用性的概念,分析了不间断电源的内部设计、不间断电源系统的配置以及相关的配电结构,并给出了提高不间断电源系统可用性的方法。
不间断电源是工业领域负载断电保护的关键设备。对于电源故障保护,不同的负载应用有两种类型。一个是普通的电脑设备。停电时,UPS电源需要为负载提供几分钟到十分钟的备用供电时间。在这个备份时间内,加载设备会进行数据存储等动作,防止数据丢失,然后加载会关闭。UPS达到备份时间后,负荷仍会被切断,但这不会造成经济损失。另一种是在数据中心、工业应用等场合,对UPS的要求是真正的不间断供电,而UPS系统必须提供全年24小时不间断供电。本文对可靠性和可用性的讨论就是针对这种情况。
电源的可靠性通常可以用MTBF(平均故障间隔时间,或平均故障间隔时间,以小时表示)来表示,还有一个更容易理解的指标AFR(年故障率)。AFR与MTBF成反比关系,即AFR=8760/MTBF。因此,MTBF越长,年故障率越低。
对于可修复系统,还有另一个可用性指数,定义为A=MTBF/(MTBF MTTR),其中A是百分比指数,MTTR是修复故障的平均时间。如果系统在发生故障时能够非常快速地恢复,那么系统的可用性指数会更高。对于电网这样的对象,利用可用性指数可以更直观地衡量其可靠性。然而,对于关键场合经常使用的并联冗余配置,可用性指标比可靠性指标更实用。
可靠性/可用性指标都是统计学意义上的概念,电力系统的可靠性/可用性和构成系统的每个模块的可靠性/可用性之间也存在统计相关性。
假设电源系统中有两个电源模块,由并联,操作,其中一个单独于另一个,如下图所示。
然后,如果我们检查结合这两个模块的系统的可用性Asys与每个模块的可用性A1和A2之间的关系,则存在Asys=1 (1AFR 1)(1AFR 2)。另一种可能是系统中的两个模块串联,如下图所示。
那么在这两个模块的组合系统的可用性Asys和每个模块各自的可靠性A1和A2之间存在关系。
Asys=A1A2因为可用性必须介于0和1之间,所以两个并联模块的总体可用性高于它们各自的可用性,而两个系列模块的可用性低于它们各自的可用性。
不间断电源的可靠性
从单个UPS的设计来看,整个产品可以分为多个模块。下图是典型的UPS系统结构图。
从图中可以看出,不间断电源各模块之间的依赖关系是复杂的,但并联之间的关系仍然可以划分如下:
辅助电源与所有其他模块串联,因此辅助电源的可用性直接限制了系统能够达到的更高可用性水平;
控制模块与辅助电源以外的其他模块串联,因此控制模块的可用性将直接影响系统的整体可用性设计。
对于负载侧,只有旁路模块和逆变器模块可以直接连接,这两个模块来自并联
PFC/整流器模块和电池升压模块为并联,然后与逆变器模块串联;
从能源提供商的角度来看,旁路电源和商用电源是两个单独的电源,电池能量由商用电源通过充电模块提供。如果充电模块出现故障,电池将没有储能,实际上无法实现正常的UPS功能,所以市电-充电模块-电池也是串联的。这样就可以画出整个UPS系统可用性串的并联路径图。
从这个路径关系中,我们可以看到并联,总共有三条路径,每条路径都由几个模块串联起来。就像前面的分析一样,辅助电源和控制模块的可用性在所有路径上都是串联的,所以如果两者的设计都有缺陷,那么UPS的可用性不可能很高。电池回路串联模块数量更多,也是可用性更低的路径。
要提高系统的可用性,首先要提高关键路径的可用性。从路线图可以看出是控制模块和辅助电源。辅助电源是整个不间断电源的关键。如果辅助电源不工作,整个UPS就会瘫痪。提高辅助电源可用性的方法有很多:一是提高设计和MTBF;一是将并联冗余设计应用于辅助电源,以提高可用性;另一种是对UPS的三种可用路径使用不同的辅助电源,相当于将原来完全串联的路径改为并联,这些方法可以在UPS设计中混合使用。由于以上三个可用性通道均来自并联,而旁路通道本身是可用性更高的一个,所以更推荐的设计是优先提高旁路,的可用性,单独为旁路使用一套辅助电源,并且尽量使用简单的设计让这个电源具有高MTBF。
控制模块也是影响所有路径的关键点,必须具备高可用性。参考辅助电源的处理方法,相对单独的旁路路径也可以配备单独的控制模块,配合其他控制功能,可以达到高可用性。同样,旁路上的控制模块应该尽可能简单,以提高可靠性。推荐的方法是,旁路控制模块不断检查不间断电源主控制模块的状态,如果找到主控制模块,它将自动切换到旁路模式。此外,对于主控模块,还可以通过冗余提高可用性,比如采用双MCU结构,当一个MCU检测到另一个MCU出现故障时,可以接管另一个MCU的功能,或者采取旁路等应急措施,保证负载不间断。对于UPS来说,电池是保证UPS在市电或旁路停电时能够继续维持供电的关键,但串联环节更多,这恰恰是可用性更弱的环节。一般电池规格会注明充电电流不要超过0.15CC,也就是说UPS完全放电后电池需要多次充电。从这个意义上说,它的可用性一般在20%以下。但由于电池不连续工作,只要完前市电源放电后电池恢复,再充电时不停电,就不会影响负载。从这个角度来看,即使只有短暂的停电,电池的可用性仍然很高。
重新检查电池电路的可靠性,电池和电源之间有充电器模块连接。如果充电器损坏,电池一次放电后无法充电,导致下次市电停电。但充电器只在电池需要充电时才工作,因此如果能及时监测充电器的状态,并在充电器出现异常时及时报警,就可以避免充电器故障带来的问题,从而提高整个UPS的可用性。电池也是如此。电池在多次使用后也会面临容量下降和失效的问题。但如果通过电池状态监测发现电池故障并及时更换,也能有效提高UPS的可用性。
不间断电源系统的可靠性
因为UPS不是一个单独的应用系统,需要结合其他环境因素,所以这些外部因素也必须考虑在内。如前所述,UPS电池的待机时间是有限的。如果断电时间比较长,导致电池完全放电,负载仍然会断电。因此,不间断电源的可用性会受到市电长期断电概率的影响。
为了解决这个瓶颈,可以在UPS系统中加入一个特性和电池互补的备用电源:在市电断电时不需要快速响应,但在长期停电的情况下可以持续供电,燃油发电机组是更适合的选择。因此,可以在不间断电源系统配置中增加一个自动切换装置,以便在市电故障后切换到发电机组。这样可以明显提高UPS系统在长期停电情况下的可用性。那么不间断电源系统的可用路径就变成了
虽然在可用性路径中串联了一个用于在市电和发电机之间切换的附加ATS,这增加了单调路径中的故障概率,但对于相对长期的电源故障所导致的可用性问题来说,这是值得的。
不间断电源应用的另一个分支是正在兴起的DC不间断电源系统。DC系统的思路是以提率为目的,减少供电系统中间的转换环节,配电部分由交流转换为DC。一个理想的DC UPS系统服务器应用从市电到12V终端的应用结构如下图所示。为了比较,下图显示了相应的交流应用结构。
可以看出,理想的DC UPS系统可以通过将交流系统中UPS的逆变器链路替换为服务器电源中的PFC链路,再替换为隔离的DC/DC链路,从而提高其效率。但是在DC UPS系统中,由于电池电压的范围比较大,为了获得更优化的效率曲线,后期在服务器电源中也可以采用两级结构。即通过简单的转换,缩小服务器电源隔离DC/DC转换级的输入范围,获得更好的节能效果。此时的结构如下所示。
在这个DC不间断电源系统中,交流不间断电源中没有旁路电路,只有一个到电池回路,的主电源,这个电路也用作充电器。因此,考虑到单台UPS的可用性和可靠性,DC UPS可靠性环节只有两个,一个是两级转换加辅助电源和控制板,另一个是电池,如下图所示。
与交流不间断电源相比,DC不间断电源缺少交流不间断电源的旁路电路和提高可用性的电路。但电池直接给负载供电,其可用性高于交流UPS。因此,就可用性而言,DC供电系统有利有弊。然而,另一方面,DC系统比交流不间断电源更容易并联,因此它可以通过增加并联单元的数量来增加可用性。
配电系统的可用性
对于一般的UPS系统应用,常见的配置模式有两种,一种是双机热备份,如下图所示。
正常情况下,电源由UPS1提供。如果UPS1的逆变器/整流器部分损坏,仍有UPS2供电。第二种配置模式是双并联冗余,如下图所示。
在这种配置下,两个UPS完全是并联-operated.的基于之前的可用性原则,第二种配置方式比另一种配置方式具有更高的可用性。
这反映了可用性和可靠性之间的明显差异。对于两个冗余并联配置的UPS,由于组件数量翻倍,故障概率会增加,因此整个系统的MTBF会统计性下降。但由于其中一台发生故障后仍在工作,只要故障UPS能够快速修复,负载仍处于有效保护之下,可用性提高。从负载的角度来看,评估系统的可用性比可靠性更有意义。
在可用性的定义中,电力系统的恢复时间越短,可用性越好。因此,将电源系统设计为模块化且易于更换的结构可以明显减少维护时间,从而显著提高可用性。
对于机房的应用,双总线的概念被普偏使用。对于关键的服务器负载,通常提供两组电源输入。因此,两组单独的电源总线也可以相应地用于配电部分。结合UPS本身,支持双总线输入,其实可以构造很多组合。对比不同方式后,对比推荐的典型结构如下图所示。这里两套单独市电供电两套UPS系统,然后每套UPS系统作为一条总线,可以充分发挥UPS 双总线,内部双总线和负载双总线市电高可用的优势
结论
本文对UPS电源的内部设计、不间断电源系统和配电系统的可用性进行了分析,并给出了提高不间断电源供电系统可用性的思路。通过分析结果可以发现,采用单独旁路和市电的电源,增加多CPU监控和电池监控,可以明显提高UPS的可用性。另一方面,在系统层面,选择模块化结构,缩短维护和更换时间,使用更多的并行结构,也可以显著提高可用性。