中国新技术新产品2023NO.9(上)-53-工业技术传统轨道交通设备故障主要依靠人工巡检和排查,效率低下且易漏检。另外,一些先进企业引入了很多先进、高精密的检修系统,随着长期使用,积累存储了大量设备故障资料,在设备检修维护过程中进行复用、查询极为不便。因此,如何保证更快速、高效地对轨道交通设备故障进行排查诊断等,已成为轨道交通运营管理研究领域中的热点问题。该文针对积累存储的设备故障数据,利用知识抽取、知识融合等技术构建知识图谱模型[1],研发了一种基于轨道交通设备故障知识图谱的智能搜索应用。对用户输入的词条自动抽取知识图谱中的故障实体节点,生成连续式返回结果。保证更快速、高效地进行部位排查、预防解决等,使大量多源异构数据的关联与复用充分发挥价值,提高检修人员工作效率。1设计思路该文面向多数据源轨道交通设备故障知识库,包括故障报告、巡检日志等,通过数据预处理使其变为结构化数据形式,再利用数据分析技术构建故障实体属性及关系模型,通过知识抽取、知识融合等构建故障知识图谱,建立知识存储与图谱智能搜索应用。首先,采用远监督方法对故障数据进行分析处理,可以从大规模的未标记数据中自动抽取关键信息。定义故障实体节点及属性值,包括故障设备、故障原因等,明确实体之间的关系,基于三元组规则抽取故障知识实体、关系及属性,实现故障知识抽取,提高知识图谱的质量和准确性。其次,从实体节点和故障处理2个维度考虑,构建知识图谱模式层,将知识分解成各种主题类别,满足设备故障快速定位、故障诊断及维修建议智能推荐等关键应用场景。结合相似度匹配进行实体对齐,减少实体冗余和错误,实现知识图谱构建过程中的知识融合。最后,利用知识图谱智能搜索引擎为用户提供直观的故障分析、预测和决策支持,提高轨道交通设备故障处理效率、准确性和智能化水平。2知识抽取2.1基本过程设计由于结构化与半结构化的故障数据格式与内容已知,相关属性值识别后可直接通过三元组规则进行抽取,而非结构化数据文本需要基于句法特征进行命名标注,因此将数据结构统一后进行三元组映射。首先,对非结构化原始数据进行预处理,如文本清洗、分词和词性标注等,便于后续实体识别和关系抽取操作[2]。其次,利用命名实体识别技术识别文本中的实体,包括故障设备、故障现象等,再提取实体间的相互关系,如设备和部件的依赖关系、故障现象与原因之间的相互作用关系等。此外,通过实体对齐技术对不同文本源中同一实...