http://bhxb.buaa.edu.cnjbuaa@buaa.edu.cnDOI:10.13700/j.bh.1001-5965.2021.0471融合FastDTW与SBD的稀有时间序列分类方法李显,牛保宁*,柳浩楠,张旭康(太原理工大学信息与计算机学院,晋中030600)摘要:稀有时间序列分类(RTSC)在天文观测等领域有广泛应用。针对目前稀有时间序列方法处理大规模数据集存在准确率低和时间成本高的问题,以天文观测中的短时标稀有天体光变事件——耀发现象为研究对象,提出改进的稀有时间序列分类方法RTSC-FS。该方法融合动态时间弯曲(DTW)的改进FastDTW和SBD度量序列距离,同时具有FastDTW计算复杂度低、衡量精度高和SBD计算速度快的特点,采用滑动窗口过滤、重采样、窗函数平滑、标准化数据等数据预处理技术进一步降低时间成本。在由地基广角相机阵(GWAC)记录到的星等变化的时间序列数据集上,所提方法从约791万天次的光变数据中发现具有耀发特征的曲线44条,召回率60.27%,查准率达34.65%,相比Baseline发现数量更多,召回率、查准率有所提升。关键词:稀有时间序列分类;FastDTW算法;SBD方法;地基广角相机阵;星等中图分类号:TP311文献标志码:A文章编号:1001-5965(2023)06-1523-10稀有时间序列分类(ratetimeseriesclassification,RTSC)是从大规模的时间序列数据集中寻找极少的、具有固定特征的样本,其在科学研究领域有着广泛的应用。时间序列数据是一类具有先后顺序的数据点构成的序列,具有数据量大、价值密度低的特点。在天文观测领域,随着现代时域天文观测技术的发展和高性能观测设备的使用,在大规模数据中发现稀有时间序列数据成为天文事件发现的重要手段[1]。地基广角相机阵(ground-basedwide-anglecamera,GWAC)是为中法天文卫星项目SVOM[2]建设的时域天文巡天设备,每15s采集观测数据一次[3],目标是发现与监测伽马射线暴的光学瞬时辐射和其他剧烈变换的天体[4]。GWAC采集的天体点源图像数据经过处理后生成光变曲线,反映天体在某一时间区间内的亮度变化,属于时间序列数据。在时间跨度达6个月的情况下,GWAC在设定的89个天区范围可观测到约790万天次的光变数据,从这些时间序列数据中发现符合特定模式的稀有时间序列数据是科研人员面临的一个主要问题。动态时间弯曲(dynamictimewrapping,DTW)及其改进算法[5-8]是时间序列挖掘的有效算法,其被用于发现稀有时间序列时,存在以下问题:①目标时间序列稀少,如果不进行初步筛选,算法在全部的数据上发现目标序列的时间成本高。②...