基于异常值检测矩阵分解的服务质量预测张园园,朵琳**,韦贵香(昆明理工大学信息工程与自动化学院,云南昆明650500)摘要:基于QoS感知的Web服务推荐是帮助用户找到高质量服务的解决方案之一.为了准确预测候选服务的QoS值,通常需要收集用户的历史QoS数据.然而,现有的方法大多忽略了历史数据中的异常值会导致预测准确度降低.为了解决这一问题,提出一种基于异常值检测矩阵分解的服务质量预测方法.首先,使用基于K-means的隔离森林算法先对历史QoS数据进行聚类,将历史数据中的异常值剔除;然后,将其用于改进的矩阵分解模型中对未知值进行预测;最后,利用柯西损失来评估观察值与预测值之间的差异.实验采用WSDream数据集进行测试,结果表明,提出的异常值检测模型的响应时间的MAE与RMSE指标平均提高了19.11%和39.59%,吞吐量的MAE与RMSE指标平均提高了9.82%和29.89%,证明所提模型有效改进了预测准确度.关键词:K-means聚类;异常值检测;矩阵分解;柯西损失;服务质量中图分类号:TP311文献标志码:A文章编号:0258−7971(2024)02−0255−10Web服务是面向服务的架构、云计算和物联网等技术的关键组成部分.近年来,互联网上Web服务数量急剧增加,因此在许多具有几乎相同功能的Web服务中选择最优的Web服务是用户面临的挑战之一[1].一般来说,服务质量(qualityofser-vice,QoS)包括响应时间、吞吐量等参数,是评价服务推荐性能的重要非功能性指标[2].QoS可以区分具有相同功能的不同Web服务,并且可以在一定方面反映Web服务的质量信息.因此可以根据用户的QoS偏好和候选Web服务的QoS值选择最合适的服务[3].近年来,针对基于QoS的个性化服务推荐的研究越来越受到关注.研究者针对服务质量预测提出了许多种方法.其中,协同过滤(collaborativefiltering,CF)技术[4]是使用最广泛的方法之一.协同过滤根据其实现原理可分为两类:基于内存(或邻域)的方法和基于模型的方法.基于邻域的QoS预测算法[5]的关键步骤是计算用户(或服务)之间的相似度,然后根据相似用户(或服务)提供的历史QoS值预测未知的QoS.基于模型的QoS预测算法[6]需要基于训练数据和机器学习算法构建一个有能力的模型,整合来自相关用户的历史数据预测目标服务的质量.基于模型的QoS预测算法主要有矩阵分解(matrixfactorization,MF)[7-8]等技术,近年来基于矩阵分解的方法广泛应用于QoS预测领域.Zhang等[9]通过将原始矩阵分解与集成的用户聚类正则化项相结合,设计了一种个性化推荐方...