ScienceandTechnology&Innovation┃科技与创新2023年第19期·179·文章编号:2095-6835(2023)19-0179-03故障预测技术在加固式公共计算服务器上的应用刘宪忠1,赵昶宇2(1.海军装备部驻天津地区第二军事代表室,天津300308;2.天津津航计算技术研究所,天津300308)摘要:以某型号加固式公共计算服务器为研究对象,分析了设备定期维修、事后维修2种方式存在的弊端,研究了以视情维修为主的当代设备健康管理技术理论。针对设备故障特点和维修现状,将健康管理技术引入到加固式公共计算服务器中。深入研究了故障预测技术,对模块级故障通过建立模型从设备的健康状况、使用寿命、失效时间以及失效概率等方面进行预测,针对导航处理模块、供电控制模块、环境监测模块、数据存储模块和电源模块的功能和故障特点,提出了不同的故障预测方法。关键词:加固计算机;公共计算服务器;故障预测;健康管理中图分类号:TP368;TP315文献标志码:ADOI:10.15913/j.cnki.kjycx.2023.19.056定期维修和事后维修是加固式公共计算服务器2种常见的故障诊断与维修方式,在系统发生故障时,通过对当时设备的运行参数进行监测、分析和推理后诊断并定位故障的原因和产生部位。随着加固式公共计算服务器集成度和复杂性的提高,软件化和智能化水平的速度大幅提升,对设备进行故障诊断和维修的难度也日益增大,仅仅依靠专家的历史经验已经远远不能满足对设备故障诊断和维修的时效性需求。考虑到加固式公共计算服务器的复杂程度及使用条件,为了避免出现设备故障难以定位和排除的隐患,在加固式公共计算服务器的前期设计时就应重点关注设备的健康管理设计,确保系统满足运行高可靠性及安全性要求。加固式公共计算服务器的故障预测包含:①实时监控并采集当前运行设备的关键状态参数,提取原始数据特征,分析当前设备健康级别和状态,采用科学的算法对其未来可能出现的故障进行提前预判和预测,并给出设备运行状态预警,便于测试和维修人员及时发现故障;②对于预测产生的设备故障,结合故障诊断信息、备品备件状态及维修人员状态对加固式公共计算服务器的维修、维护进行智能优化决策。现有加固式公共计算服务器通常存在设备故障预测准确度不高、预测时效性不强等问题,本文基于加固式公共计算服务器开展设备故障预测技术研究,根据服务器内各个模块功能特点和故障特征,建立不同的故障预测模型和算法,并采用视情维修的方式,为保证加固式公共计算服务器设备的安全运行提供可...